Gene Cmaq_1395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1395
Symbol
ID	5709453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1473398
End bp	1474714
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	43%
IMG OID	641275906
Product	major facilitator transporter
Protein accession	YP_001541211
Protein GI	159041959
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.351043
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATCAA TGAGAACCAA GGCAATAATT AGTACAACCC TTGGTATCGC CTTTGAGTGG 
TATGACTTCT TCCTATACAG TTTACTAGCC CCGGTGATAG CGCAAGTGTT TTTCCCAAAG 
ACTATACCTG TTTTATCACT GGCTTATGCC TATGTTGTAC TCTTCATAGG ATTCGTGGGT 
AGGCCGGCTG GGGGCTTGAT CTTTGGTTAT ATTGGTGATA AATTTAGTAG GATACGTGCA 
CTATACTTCA CATTGCTCAT CGCAGGGATA TCAGTATTAT TAGTTGCAAT ATTACCTACG 
TATCAACAGA TTGGTGTAGC GGCACCAATA TTATTAGCAA TACTGAGATT TGCTGATGGC 
ATAGGGCTTG GTGGCGAATG GGGTGGTAGT TTCTCCCTAA CCTCAGAGTA CATAAATCCA 
AATCTAAGGG GCTTTTTCTC AGGTCTTCTC CAGGCTACCG TACCCGTGGC ATCTTTATTA 
GTAAGTGGAT TCACACTATT ATTCACCTCA CTGCTTGGTG AAAGCGGCTT CTACGCTGTT 
GGCTGGAGGT ATGTCTTCGC AATAGGCTTC ATCATATCAA TAATCGGCGT CTTCATAAGA 
TTTAGGGTTG CTGATTCCCC AGTTTTTCAA AAACTCGTGG AGACGGGCAG GGTGGTTAAA 
AACCCAATCT CCGGGGCGTT CAGGAGGTAT TGGAAATTAA TCCTAATGGG TTTATTCCTA 
GTAGGCATAG TAAATGGGGC TTATTACTAC CTAAACTTCG CCTTTGCACT GGGTTACGCA 
ACAACCATTG CTAAGGCATT TCATAAACCC TACGTACCCT ACTCCGTGGT CTCAGAGGGA 
GTATTAATAT CCTCCCCAGT ATTGATAATA CTTGCACTAG CCTTCGGCTA TCTATCAGAT 
AGGATTGGTA GAAGACCCTT AATATTAGCG AATGCAGTAG GCGCAATTGT TTTCATAGCG 
CCATATTTAC TAATGCTACT AAGCGGCGAC CCCACGCTTG TTATGAGCGC AATAGTGCTT 
GGTGGATTAA TTTTCTGGTT GATTTCAGGT GCCATAACGC CCATAGTACT TGTTGAAATG 
TTCCCACCTG AGGTTAGGTA TACTGGTATT TCCACTGCTT ATCAAATCGG TGTGGGATTC 
ATAGGTGGTT TATCACCATA CATACTAACA TTCATGATAT CAGCATTACA TGATATCTTC 
TGGCCACCAC TTATCTATAC AGTGGTCCTG GGATTAATAG TCCTATTCAT AGGCATAGTA 
CTGGGTGAAA CCAAGGGAAG ACTACACGTG GGTGAGGAAA TCCTAAGACA GCAGTGA

Protein sequence

MVSMRTKAII STTLGIAFEW YDFFLYSLLA PVIAQVFFPK TIPVLSLAYA YVVLFIGFVG 
RPAGGLIFGY IGDKFSRIRA LYFTLLIAGI SVLLVAILPT YQQIGVAAPI LLAILRFADG 
IGLGGEWGGS FSLTSEYINP NLRGFFSGLL QATVPVASLL VSGFTLLFTS LLGESGFYAV 
GWRYVFAIGF IISIIGVFIR FRVADSPVFQ KLVETGRVVK NPISGAFRRY WKLILMGLFL 
VGIVNGAYYY LNFAFALGYA TTIAKAFHKP YVPYSVVSEG VLISSPVLII LALAFGYLSD 
RIGRRPLILA NAVGAIVFIA PYLLMLLSGD PTLVMSAIVL GGLIFWLISG AITPIVLVEM 
FPPEVRYTGI STAYQIGVGF IGGLSPYILT FMISALHDIF WPPLIYTVVL GLIVLFIGIV 
LGETKGRLHV GEEILRQQ