Gene Cmaq_1153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1153
Symbol
ID	5709897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	1209736
End bp	1210839
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	46%
IMG OID	641275652
Product	major facilitator transporter
Protein accession	YP_001540970
Protein GI	159041718
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAGTA AGGCATCAGC CGTGGTTAAC ATAATGATCG CCAGATTCAT ATACAGCGTC 
TACTGGTACT ACCTGGCACC AGCCTTACCG TTAATTAAAC TGGAATTCAC AGTACCTAAT 
TATGAACTCG GCTTAGTCCC ACTCTTCTTC ATAATAGGGG CTGGCTCATT CCAAATACCG 
GCAAGCGTGA TCGCTAGGTT TATCGGTAAC GTTAAGACTG CTGTACTCGG CTTAACCCTA 
CTATCAGCGG CTGGGGTAGC CACGGCCTTC AGTGTAAGCT TTAATGAAAT ACTAGCCCTA 
AGGCTACTGG CCGGTATTGG CGCGGCATTA TTCTTCTCCA CGGCAGCCAC TGTTGTAACT 
AATCTGTATC CTGGTAGAGA GGGGTTGATG CTTGGTATAT ATAACTCAGT GTTCAGTGCC 
GGAGCCGGAG TAGGGTTGGT TTACGGGGTT GTTTACACTA TTGTTAATTG GAGGGTTGCA 
GTACTGATTA TTAGCGTGGT GGGGTTGTTG GAATCCGTAA TACTCCTTAA GACCTGTTCA 
CCACTCAATA GGCCCATTGA CACTGGTTTA TCCATAAACA AGGGCGCAGT ATTAGTGGGT 
TTAGCCACAG CCGGGTATTG GGGGGCTAAT TACGCCGCCG GTAACCTACT ACCCACTTAC 
GCCGTTAATC ATGGTGTTGG TTTAGTTAAC GCCTCATTAA TAACATCACT ACTCCTCTTC 
TCAAGCCTAG TGGGTGGTTT ATCAGGTAAA TTAGCTGATT TAACCAGTAG GAGGGAGCTC 
TTAATTATTG CACCCGCGGT GTTGGGTTCA TTATCATTCC TACTAATCAT AACACTTAAC 
CCCTACGCCA TGATAGCCTC AACACTCATA GTGGGTTACA CCAATGAACT CATGATCACC 
GCCTCCTATG CGCTTGTCGT TAATGATTCA AACCCAACCA TGAGCCTCGC AACAGTTAAC 
ACGTTAAACA TGGTTGTAGG CATGTGGTTA AGCCCATTAT TCACAGCAGT CATGGGTAAT 
TCAACGTTAC CATGGATCAC AATGATCATA GCCTCAGTGG CACCACTACC CCTCCTACTG 
GTTAGGCGTA GGGTAGTAGG GTAA

Protein sequence

MVSKASAVVN IMIARFIYSV YWYYLAPALP LIKLEFTVPN YELGLVPLFF IIGAGSFQIP 
ASVIARFIGN VKTAVLGLTL LSAAGVATAF SVSFNEILAL RLLAGIGAAL FFSTAATVVT 
NLYPGREGLM LGIYNSVFSA GAGVGLVYGV VYTIVNWRVA VLIISVVGLL ESVILLKTCS 
PLNRPIDTGL SINKGAVLVG LATAGYWGAN YAAGNLLPTY AVNHGVGLVN ASLITSLLLF 
SSLVGGLSGK LADLTSRREL LIIAPAVLGS LSFLLIITLN PYAMIASTLI VGYTNELMIT 
ASYALVVNDS NPTMSLATVN TLNMVVGMWL SPLFTAVMGN STLPWITMII ASVAPLPLLL 
VRRRVVG