Gene Cmaq_0387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0387
Symbol
ID	5708627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	422514
End bp	423917
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	45%
IMG OID	641274890
Product	major facilitator transporter
Protein accession	YP_001540223
Protein GI	159040971
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.285838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTCTA TAAGAGTCAT GAGGGTGCTC ATATTATTCA CCACTTCATT AGCCGCGTTT 
CAAACCCCCT TCAATTCAAC AGTCCTATCC TTCATAGTTC CTGTACTTGG TAAATACTTC 
CACGCCTCAT TGTACACGCT GGTTTACGTG CCTGTGGTTT ACTTAATACC ATTACCGACA 
TTAATGGTGC TACTGGGTAG GATTGCTGAT ATTTACGGTA GAGAGAGAGT CTTCAGGATT 
GGTTTCGCAT TATTCATAGT GGGTTCACTT ATGGGTGCTT TTTCACCAAG CATCTATGTT 
TTAATAGCAT CATCATTAGT GATGGGGCTT GGGTCATCAA TACTATCACC AAGCTCCACA 
GCCATAGTTA GCCAAGTCTT CCCAGAGGGT GAGAGGGGGT TTGCCTTAGG TATTAACGCA 
ATGGCCGTCT ACATGGGCTT AACCTCAGCA CCATTCCTAG GTGGGTTAAT TACCCAATTC 
CTCGGCTGGA GATTCGTATT ACTGGTTACC ACATTACTCT CAGTAATTGG CTTAGCGGTA 
TCATTCGTAT CCATGAGGGG TATTGACTTA CCTAGACGCG GCATCCCCAT TGATGCAGCT 
GGCGCAGCCT CATTCTCAAT AGCCCTCCTC TCAATAGTAA TATTCATGAT ACTGGCGGCC 
ACGGGTGATT GGTTAAATTA CCTTTACCTA CCAGTAATTA GTGCGGCTTC ATTTGCTTTA 
TTCATAGTGA TCGAGGGGAG GGTTAAGGAT CCTATGCTTA ACTTAAGCTT ATTCACCCGT 
AACATATCAT TCATGGCTGG TAACGTGACT GCTTTACTAA ACTACATAAG CACGTACTCG 
GTACCATTCC TGTTCTCACT CTACCTACAG TCAATACTCG GCTACACACC CTTTGAGGCA 
GGCCTAATAC TAATCCCTGA ACCAGTATTC ATGGTAATAC TCTCACCCAT TAGTGGTAGA 
CTCTCCGATA TCTATGGTTC AAGGGAAGTG GCTGCATTGG GAATGGGGCT CATAGGCTTA 
GCGTTCATAA TGCTACTTAT CCTTAACCTA AGGAGTGTAG TTAACGTGGT ACTGGCTTTA 
TCGGTATTAG GCGTAGGCTT CGGCTTCTTC TCAGCACCCA ACACTAACTC AGTAATGGGC 
TCAATAACAC GGGATAAGTA CGGTGTGGCA TCGGGGGTAT TGGGTACCAT GAGGTTCACC 
GGCCAATTAC TAAGCATAAC CCTAGCCAGC GCGATACTGG CTAAGTACCT GGGTAAGTAC 
ACTGCATTAT ACCTATTCAC TGGAGTACCA TTAATGAGCA CTATAGTGTA TGGTTTATTC 
ACAGCGGGGT TGAGGATAAT GTTCATCATA GCTGCTGCAT TAAGCTTCAT AGGTGCATAC 
ACGTCACTAC TTCGTGAAAG GTAA

Protein sequence

MESIRVMRVL ILFTTSLAAF QTPFNSTVLS FIVPVLGKYF HASLYTLVYV PVVYLIPLPT 
LMVLLGRIAD IYGRERVFRI GFALFIVGSL MGAFSPSIYV LIASSLVMGL GSSILSPSST 
AIVSQVFPEG ERGFALGINA MAVYMGLTSA PFLGGLITQF LGWRFVLLVT TLLSVIGLAV 
SFVSMRGIDL PRRGIPIDAA GAASFSIALL SIVIFMILAA TGDWLNYLYL PVISAASFAL 
FIVIEGRVKD PMLNLSLFTR NISFMAGNVT ALLNYISTYS VPFLFSLYLQ SILGYTPFEA 
GLILIPEPVF MVILSPISGR LSDIYGSREV AALGMGLIGL AFIMLLILNL RSVVNVVLAL 
SVLGVGFGFF SAPNTNSVMG SITRDKYGVA SGVLGTMRFT GQLLSITLAS AILAKYLGKY 
TALYLFTGVP LMSTIVYGLF TAGLRIMFII AAALSFIGAY TSLLRER