Gene Cmaq_1143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1143
Symbol
ID	5710143
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1198814
End bp	1200013
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	41%
IMG OID	641275642
Product	major facilitator transporter
Protein accession	YP_001540960
Protein GI	159041708
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.41427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTTA AGGCTATTGG GCGTGAGGGA GTATTACTTG CCGTGGCCAG TTCCATAACC 
GGCATTATGT TCGGTGCTAA CTCAGTCATA TTATCAATAT ACATGCTTAA CATAGGTATG 
AAGCCGACTT TAATAGGTGT TGTTATTGGT GCTTCATCCC TCATGAGTGC CCTTGGATCA 
TTAATCACCG GCTACTTATC CGACTTCATT AATAAGTTAA GCCTATTCAC GTTTCTCTCA 
TTAGCAAGTG GTTCATTGAT ACTACTGTTG GTTACTGGTT TACCACCAGT GATAACTATG 
GTTTACCCGC TCATTGCCTT GCTTAACCGC AACGTTATAT CCATTGCTAT TTCCGGTGAG 
TATGCTAGAC GAAGGGGGAT ATCCAGTGAA TTCTTCAGCT TATCATCTTC ACTTAACGTA 
GTATTCAGTG TTATTGGGTC ATCAATAACT ATGTTACCAA GCTACATGGG TAGAATGGGG 
TATGACTTAG TCTTCATTAT TGAATCACTA TCAGTGTACT CATCAATACC AATAATGCTT 
ATAGCCATTA GGAGAATAGG CATTAATGTA ACTGAGGTTA AGATCAGCAG GGTTAGTTTA 
AGGGAGTTAA GGGAGTTGAA GTCATCGTGG TTACTTAAGA GGCTTATTCC CGAATCATTA 
ATAGGACTTG GGGCGGGGGT AATAATTCCC CTCTTTAGCC TGTGGTTTTA CTTAAAGTTC 
CACATAAATA TAAGTAACTT AAGCATAGTG TACGCTGCAT CAAATGCAAC GTTAGCATTA 
GGTACATTAA CGGCACCTAT GATTTCAAGA ATACTGAGAA GTAGGGTTAC CTCAGTAATA 
TTACTGGAGG GTTTAGCTAC AGGTATATTA GCTTTAATGC CAATCATACT GAACATCCCT 
TCATTACTGG TACTCTTCAT AGTTAGGAAC ACCTTAATGA ATATGGCTAA TCCTCTACTA 
ACATCATTAA TCAACGACCT AGTGCCGGGG GAGGAGAGGG GGAGGGTTTT CGGTATATGG 
ATGCTCCTAT CATCAATACC GCGTGCACTG GGTCCGGGAA TAGGGGGTTA CTTAATGGGT 
TCCGGTTACC TGGATCTTCC ACTATACATA ACATCACTAC TATACGCCAC TGCAGTGGCC 
TTATTCTACG TTCTGCTTAA GGATGTTGAG AAGATGAGTA GGTTAACCAT AGGTAGGTGA

Protein sequence

MSFKAIGREG VLLAVASSIT GIMFGANSVI LSIYMLNIGM KPTLIGVVIG ASSLMSALGS 
LITGYLSDFI NKLSLFTFLS LASGSLILLL VTGLPPVITM VYPLIALLNR NVISIAISGE 
YARRRGISSE FFSLSSSLNV VFSVIGSSIT MLPSYMGRMG YDLVFIIESL SVYSSIPIML 
IAIRRIGINV TEVKISRVSL RELRELKSSW LLKRLIPESL IGLGAGVIIP LFSLWFYLKF 
HINISNLSIV YAASNATLAL GTLTAPMISR ILRSRVTSVI LLEGLATGIL ALMPIILNIP 
SLLVLFIVRN TLMNMANPLL TSLINDLVPG EERGRVFGIW MLLSSIPRAL GPGIGGYLMG 
SGYLDLPLYI TSLLYATAVA LFYVLLKDVE KMSRLTIGR