Gene Cmaq_1813 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1813
Symbol
ID	5709189
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1890588
End bp	1892030
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	45%
IMG OID	641276319
Product	major facilitator transporter
Protein accession	YP_001541621
Protein GI	159042369
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATATAA ACACAAGTCG ATTAATCGCT AATGTGGCTA GTCAACCCGG TTACACTAGA 
GAAGACATAG AGAGGGGTAT AAAAAGAATA TACCAGGTCG TTCTTGCCCA GAGCCACGTT 
ACTCCATACT TCATAATTGG CATAGCCATA GCCTCCCTAT TTCTCGATGC GTATGATTTC 
AGCGCATTTT CACTAGCAAC GGCAGCATTC AAGAACACAT GGCCATGGAT GTCCTCCGCC 
CTCTTTGGAT TTGCCATAGC TTCCATACAA ATAGGAGCTA CGATAGGTGC TCTGACGGGT 
GGGTGGTTGA ATGATAGGAT AGGCAGGAGG AACATGCTTA TACTTAACAT GATCCTGTTC 
GTAGCTATGG CTATTGGTGC TGGTTTGGCA CCGGATCCCT ACACGTTCTC AATATTCAGG 
ATATTGCTGG GTTATGCGTT AGGTGCAGAC ATAGTTACGG GGTTTAGCTA CATCTTCGAG 
TTCCTTGAGT TCAATAAGAG ACTCGTGTTC TCTGGCGGTT TTGATGCATA TTGGTTTGGT 
TCTGTGGTGT TTGCCATAGT ATTCATAGTT TTTCCACTGT ATTTTGCACT ACATTCATTA 
ACGCACCCAA TAATATGGAG GGCCATCATG GTTATTGGCG GTATTGCTGC CTTCATAATT 
CTTCTGTTTA GATCAAGGAT ACCTGAATCG GTGCTTTGGA TAGCATATAG GGGTAGATTA 
GCTACGGCGA AACGAATAAT TAAGCAGGTA TATGGAATAG ATTTACAGGA TGTACCGGAT 
GTTGACTTGG ATATACACAA GGTTCGTGGT TTCAGGAGCT TGTTTAGGAT ATTCAGGAGG 
AGTAAGTGGA AGGAACTCAC CAGTACCTTT ATAGGCACCT TCGAGGGTGG AATCGAGTTT 
TACTCCTTCG GTTTCTATAC TCCATATATC TTATTGGTGC TTTCAAAAAT AGGCTCACTG 
GCTACCCTAG TCTCAACTAC CATAATAAAT GTTGCGGGAT TCGCGGCGGG CATTGCTACG 
GCATATCTTG TTCCGAGACT TGGTACGAAG AATCTATACG TCATAGGTAC ACTGGGTACT 
GGTATCTCGA TGCTTGCGGC ATCCTTCGTA TTGCCGCCCA AGATAGTGCC ACTGATAGTA 
TTTTTCGCTA CAACATTCTT GGTGTTCCAC GTAATGGGAC CCAATGGTGT ACAGTCATAC 
GTAATGATAA ACACGGCATA CGGACCTAGT GAGAGAGGTA CAGCAGGTGG CTGGAACTAC 
TTCTTCAGTA AACTGGCGGC AGTTGTAAGC TCCTTCTGGG CACCCATTCT GTTCAGCTCG 
ATCGGCGTAG TGAATACATT ACACTTCCTG GCAACATTCG CATTTATCAC TGCAGTGATA 
GGTGCGGTCC TCGGATTCGA TGCGAGGAAG TATAGGACGG AGGAAGAGGC CATTCCAACA 
TGA

Protein sequence

MYINTSRLIA NVASQPGYTR EDIERGIKRI YQVVLAQSHV TPYFIIGIAI ASLFLDAYDF 
SAFSLATAAF KNTWPWMSSA LFGFAIASIQ IGATIGALTG GWLNDRIGRR NMLILNMILF 
VAMAIGAGLA PDPYTFSIFR ILLGYALGAD IVTGFSYIFE FLEFNKRLVF SGGFDAYWFG 
SVVFAIVFIV FPLYFALHSL THPIIWRAIM VIGGIAAFII LLFRSRIPES VLWIAYRGRL 
ATAKRIIKQV YGIDLQDVPD VDLDIHKVRG FRSLFRIFRR SKWKELTSTF IGTFEGGIEF 
YSFGFYTPYI LLVLSKIGSL ATLVSTTIIN VAGFAAGIAT AYLVPRLGTK NLYVIGTLGT 
GISMLAASFV LPPKIVPLIV FFATTFLVFH VMGPNGVQSY VMINTAYGPS ERGTAGGWNY 
FFSKLAAVVS SFWAPILFSS IGVVNTLHFL ATFAFITAVI GAVLGFDARK YRTEEEAIPT