Gene Moth_1315 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1315
Symbol
ID	3831802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1359167
End bp	1360384
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	44%
IMG OID	637829251
Product	major facilitator transporter
Protein accession	YP_430171
Protein GI	83590162
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.415669
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAGAAG TTTCTAAGCC ATTGTTATCT CCATATCGAT GGGTAATTCT AATTGTAATG 
TGGTTTGCTA TATTTGTCGG GGTCGTCACT CAGTTTCAGG TCGCTGCCCT GGCATATAAG 
ATTATTCCGC TTTTCAAGCT TAACTCAAGG CAATTTGCCA TGATCTTTTC AGCTCCCATG 
TTATCAGCAG TATTTCTTAG TCTTGTGGCA GGAGCATTGG CAGATAAATT TGGTGTGAAG 
GCAATCGTCT CCAGCGGGTT TGTTTTTTCC ATATTAGGAG TCTTTTTCCG GTATTCAGCT 
CATGATTTTA AGGAATTGTT TATTTTAATG TTCTTATCGG GCATTAGTTC AGCTGTCTTG 
AACGCCAATG CCTCCAAACT GCTTGGCGCA TGGTTTCCTA AAGAGCAAAT GGGAACCGCT 
ATGGGAATTT ATTTTTCGGC TAGTTATACC GGGATGGGTA TCGCTTTAGC CACCTCTGCC 
TTGTTTCCAA CAATTAAAAG CGCTTTTCTC ACTGCAGGTT TCCTCATGAC AGGCGTATGG 
ATTTTATGGA TGGCGTTTAT AAAGGCCAAG CCAGAGGGGG CACCTGATTT GCCGTTCATG 
CCTGTTACAA GGTATATTGG TGTAGCTGCT AGAAGCAGGA ACGTGTGGAT GGTCGGCGTA 
GTAATGATGT TTTTTATGGG TGCAACCATA GCATTTTCTG GCTTTCTCCC CAATGCCCTC 
CATGAGGTGC GGGGATTGAA CCCGATAGAA GCCGGCTTGA TAGCCTCTAT TGTTACATTT 
ACAAATATTA TTGGCAGTAT TATAGGCCCG GTAATCTCCG ACTATACTGG TAAGATCAAG 
CCATTCCTGG CACCTGTGGC TTTGTTGGCA GCTTTTGTTA TGTACACTTC CTGGCTTGTG 
CTTCCAGGAG TGAGTATGTG GGCATTGCTT GCCCTTACCG GAATCTTGAC GGGCATCATC 
GCACCGTTAC TTATGGCATT CCCCATGTTA CTACCCGAAA TAGGCCCTGT ATATGCCGGA 
AGCGCCGGAG GAATCATCGC TACCCTCCAA CTTATCGGTG CATTTTTCAT TCCATCTTTT 
ATTATCGCCC CTTTAGCGGG CCAGAATTAT AACATGTTAT TTGCTTTGAG TAGTTTTTGT 
ATGTTAATTT CTGGCGCTGT GACTTTATTT CTTCCGGAAC TAGGCTTTAA AGCCCGGAAG 
GATACAAAAG ATAGCTAA

Protein sequence

MKEVSKPLLS PYRWVILIVM WFAIFVGVVT QFQVAALAYK IIPLFKLNSR QFAMIFSAPM 
LSAVFLSLVA GALADKFGVK AIVSSGFVFS ILGVFFRYSA HDFKELFILM FLSGISSAVL 
NANASKLLGA WFPKEQMGTA MGIYFSASYT GMGIALATSA LFPTIKSAFL TAGFLMTGVW 
ILWMAFIKAK PEGAPDLPFM PVTRYIGVAA RSRNVWMVGV VMMFFMGATI AFSGFLPNAL 
HEVRGLNPIE AGLIASIVTF TNIIGSIIGP VISDYTGKIK PFLAPVALLA AFVMYTSWLV 
LPGVSMWALL ALTGILTGII APLLMAFPML LPEIGPVYAG SAGGIIATLQ LIGAFFIPSF 
IIAPLAGQNY NMLFALSSFC MLISGAVTLF LPELGFKARK DTKDS