Gene Cmaq_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1968
Symbol
ID	5708442
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	2044154
End bp	2045629
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	47%
IMG OID	641276478
Product	major facilitator transporter
Protein accession	YP_001541774
Protein GI	159042522
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.632276
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAATTA ATAATGCGGA GTATGACCTT AAGTACGCCT ATAGGGCAAT GGTCATACTT 
GCCTCATTAG CGGTAATAGT AATGTATATA GAAGGCATGT TAATACCGTC ATTAACTGAA 
ATAGAGAGGG AGTTCGGGGT AACCTCAAGT CAAGTTAGTT GGGTCCTCTC ATCATACCTA 
CTCTCCGGTA CTGTTCTACT ACCAATAGTG GGTAGGCTTG GTGACATTTA CGGTAAGAAG 
AGGGTTCTCT CAGCAGTGGT CATAATATAC GCTGTGGCAG TCACATTAAC CAGTGTATCA 
CCCAGTTTCA CGTACTTAAT AGCCTTCAGG GGTATTCAAG GTATTGGAGT AACCATGTTC 
GCATTAGCCT TCAGTCTAAT CAGGGAGGAG TTTCCAAGGG AATTAATACC AAGGGCTCAG 
GGATTGGTGA GTGCAGCCTT TGGAATTGGT GCGGCAATAG CACTACCCCT GGGCGCATAC 
ATAAGCCAGT ACTTTGGTTG GAGAACAACA TACCACACAG CCATACCCTT CGTACTGCTG 
GTGGCGTACC TAATAGTGAC TAGGATAAAG GAGTCAAGGT ACAGGAACCC TAGTGCTAAG 
GTTGATTTAC CTGGGGCAGC GGTACTTGGA ATTGGATTAG GCCTGGTGGT TTACGGATTA 
ACCGAGGCAC CCATATGGGG TTGGACTAAC CCGAACACGA TAATAACCTT CCTAGCGGCC 
CTCATATTCA TAGGAGCCTT CATAGCCGTA GAGAGGAGGA GGGAGCAGCC GTTAATTAAC 
CTATCATTAT TAACTAGGAG AAACGTGTTA ATAGCTAATC TAGCCGCAAT GGTGGCTGGC 
TTCGGCCTCT TCCTATTTGA ACAAAGCCTA ATAATACTCC TCGAGGAGCC TAAGCCCGTT 
GGCTTCAACC TATCCATATT CGATACCGGC TTATACGCAA TCCCCATGGC TGTGGCGCAG 
TTAATAGTCG CCCCAGTTGC AGGCATATTA ATAACTAGGA TAGGGGCTAG GAGAATGCTC 
ATGACTGGGG CAAGTATAGC CGCCTTATTC AGCCTAATAA CCGCCGCCGT GGCCCCCCTG 
GGTTTAGGGG CTTTGATAAC ATCAACAACA TTAGCCATGG CTGGGGTAGC GGCAATGAAT 
GTATCCCTCA TTAATATCCT TGTTTTCTCA GTGGAACCGC AGGTAATGGG GGTTTCAACA 
GCAATGAACT CAGTCTTCAG GAACCTGGGT GGTACCCTAG GCCCAGCGGT GGCTGGTTCA 
CTTGAGTCAA CATTCACATC ACTGGTTCTA ATGGGTATAC TGCCGGGGCG TAATGTGCCG 
CTCTTAGTTA CAGTGCCATC AATGTACGCC TTCCAGATTG GTGCAGTAAT CTCAGCCTTA 
ACAGTGGTAA CGATAGGTAT ATTGGCTTAC TTCTCAGTGG AGGTCATAAC CTGGAGAAAT 
GAATCCCAGA CTGTCGCCTC ATTAAGCCAG GAGTAG

Protein sequence

MLINNAEYDL KYAYRAMVIL ASLAVIVMYI EGMLIPSLTE IEREFGVTSS QVSWVLSSYL 
LSGTVLLPIV GRLGDIYGKK RVLSAVVIIY AVAVTLTSVS PSFTYLIAFR GIQGIGVTMF 
ALAFSLIREE FPRELIPRAQ GLVSAAFGIG AAIALPLGAY ISQYFGWRTT YHTAIPFVLL 
VAYLIVTRIK ESRYRNPSAK VDLPGAAVLG IGLGLVVYGL TEAPIWGWTN PNTIITFLAA 
LIFIGAFIAV ERRREQPLIN LSLLTRRNVL IANLAAMVAG FGLFLFEQSL IILLEEPKPV 
GFNLSIFDTG LYAIPMAVAQ LIVAPVAGIL ITRIGARRML MTGASIAALF SLITAAVAPL 
GLGALITSTT LAMAGVAAMN VSLINILVFS VEPQVMGVST AMNSVFRNLG GTLGPAVAGS 
LESTFTSLVL MGILPGRNVP LLVTVPSMYA FQIGAVISAL TVVTIGILAY FSVEVITWRN 
ESQTVASLSQ E