Gene Cmaq_1199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1199
Symbol
ID	5708983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1263568
End bp	1264917
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	44%
IMG OID	641275703
Product	major facilitator transporter
Protein accession	YP_001541016
Protein GI	159041764
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.329766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.000717058
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAGGA GCAGTGAATT AAGGAGGGTG CATTACTTAA TATTCATGAG CTTCGCCCTA 
GGCTTCCTAA TATGGGGTTT TGTATCAACC AGTGGAATAA TGACTATAGA CTACTTCAAG 
GATTACATAC CTAAGTGGCT CCTACCAGTC TCAGTGGTAC TTGGCTACAT ATTCGTAATG 
CTAGGCGACA CTGTGATGGG TTTCCTAACG GATAGGGTGG GTAGGAAGAG AATATTCATA 
TACACCATGA GCCTTTACAC CATTGGATTA CTGGGGATGG CTGCATCACT TTATGTTAAG 
CAGGTGATCA ATCCTCTGAT AGCCTTCATC ATCTTAATGG TATCCTACGC CCTGGCTGAA 
TTCGGCGTTG GTGGTGAAGA GCCACCAGCA TTAGCCGCTA TCTCGGAGCT TATGCCAAGT 
GGCAGTAGGG GTATGATGCT TGTGCTCACG CCCAATTTCG ATAATATTGG TGCAGCCCTA 
GCTGCAGCAG TGCTTTATGC CGCATTAGTT TACACCGGTT CCGCTAGTGT ATCATCAATA 
TACGCCATGA TTGGTTCAGC CCTAGTGGTG GTTTTCCTGA CTATACTGGT TAGGTTACGT 
ATACCTGAAT CAGTGAGGTG GCTTGAATCT AGGGGTAGGG TTAATGAGGC TGTTGAGATT 
GCCAAGAGGG AGGGTCTTGA ATACGCGTTG AGTTCAGGTA ACTCGGTGGT GCAGTTTAAG 
GCTCCACCAG CTTGGTATAG GGCATTATTC CTCTCAATAA TAGGCTTCAC TCAAATAACC 
ACCTATGGCT TAATGGCGTA CACAATAATT TACCTACCAT CATTACCCTT CAGTAACAAT 
TACAATCTAC AGGCACTGGT GATACTGTTG GCTAACCTAG GCGCCTCAAT AGCTGGCTTA 
GTGGGTTTAA TAATGGATAA GGTGGGTAGG AGACCATTCA CACTCTTCGC TTACCTAGGG 
GGCTTAGTAA CCATGGTACC CATATTCCTA ATATACGCAG CCTCCAATAC ACCATTAAAG 
GCATCACTAC CAGTATTCTA CACTCTACTC TTCCTCAACA TGGTCTTCAG TGAATTCGAA 
TGGGCTGTTA GAACTGTGCT TGAGCCTGAA TTATTCCCAA CTAGGGTTAG GGGAACCTGG 
ATTGGTGTGA TTAGGTTAAT AGCATGGGGA ATATACGTAG TGTTAACCTA CTACCTATTA 
AACATATTAA GCACATACCA GTACCTGCTC ACTAACCTAA TACTATACGC AATCGGGGCT 
GCCGCCGCAG TGACATGGTT CATTTACGGT ATTGAAACCA AGGGAATACC AATAAGCACC 
TTAGATAACA TAATGAGTAA ACAAAGTTGA

Protein sequence

MNRSSELRRV HYLIFMSFAL GFLIWGFVST SGIMTIDYFK DYIPKWLLPV SVVLGYIFVM 
LGDTVMGFLT DRVGRKRIFI YTMSLYTIGL LGMAASLYVK QVINPLIAFI ILMVSYALAE 
FGVGGEEPPA LAAISELMPS GSRGMMLVLT PNFDNIGAAL AAAVLYAALV YTGSASVSSI 
YAMIGSALVV VFLTILVRLR IPESVRWLES RGRVNEAVEI AKREGLEYAL SSGNSVVQFK 
APPAWYRALF LSIIGFTQIT TYGLMAYTII YLPSLPFSNN YNLQALVILL ANLGASIAGL 
VGLIMDKVGR RPFTLFAYLG GLVTMVPIFL IYAASNTPLK ASLPVFYTLL FLNMVFSEFE 
WAVRTVLEPE LFPTRVRGTW IGVIRLIAWG IYVVLTYYLL NILSTYQYLL TNLILYAIGA 
AAAVTWFIYG IETKGIPIST LDNIMSKQS