Gene Moth_1481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1481
Symbol
ID	3832362
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1528269
End bp	1529408
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	55%
IMG OID	637829414
Product	ABC transporter related
Protein accession	YP_430334
Protein GI	83590325
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00851578
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTAA TAGCCGGGGA TATTCTTTTT GACAAAGTAC GAAAAGTTTA TGGCCGGGTA 
ACGGCGTTGC AGCAACTGGA CCTCAAGGTC GAGGCCGGGG AACGACTGGT ACTCCTGGGT 
CCGTCAGGTT GTGGCAAGAC GACAGCCTTA CGCCTGGTAG CCGGTCTGGA AAGGGTGACC 
AGCGGTAAAT TGTACTTAAA CGGCCGGCTG GCCAACAATC TGGAACCCGG TGAGCGGGAT 
GTGGCCATGG TCTTCCAGAA CTATGCCCTC TATCCCCATA TGACGGTATG GGAGAACATC 
GCCTTTGGAC TGCAGGTGCG GCGGGTGGCG AAGGAGGAAA TTAAAGCCAG AATTAAGGAG 
GCTCTGGCTA TCCTCGGCCT GGAAGGATTG GAGGAGCGCC GGCCACGGGA ATTGTCAGGA 
GGGCAGCGCC AGCGGGTGGC CCTTGCCCGG GCTATAGTTA AACAGGCCCC CTATTTCCTC 
CTGGATGAGC CCCTTTCTAA CCTGGATGCC CAATTGCGTA CCCAGGCCCG CAGTGAGCTG 
GTACGCCTGC ATCGGAAACT GAATTCGACC ATGATCTATG TTACCCATGA CCAGGTAGAG 
GCCATGACCA TAGGGCAGCG GATAGCCATC CTGGCAGGCG GCGTCCTGCA GCAGGTAGAT 
ACCCCGGAGA ATATCTACAA CCGCCCGGCC AATACCTTTG TGGCCAAATT TATAGGCAAC 
CCGCCCATGA ACCTCTTGCC GGGAATAGTA AAAGGGAACC AGTTGTTCCT CGGCGAAGGT 
CTCAAACTTA TAATACCAGG CAACTGGAGC GCCTGGCTCC TGGGTAAGTC CCAAAGCAAG 
GTGATCATGG GCCTTAGGCC CGAAGACGTT ACCTTGAGGG AAGAAGGGGT AGCCGAAGGG 
GAAGGCCTGC CAGTACGAAT TACCTGGCGA GAAAATTGTG GTAAGGAGAG ATTATATTAC 
CTGGCAGCCG GCGACAAGGA GCTAATAGCT TCTTTCAGCG AGGGCCGTAC GGAACCCCGG 
GGAGGAGAAT TATGGCTGAC CATTGACTGG AATAAGGTTC ATTTCTTTAC CGAAGGGAAT 
GGCAATTCCC TGGGTTACCC CTGGAATACC CGGGAGTTGT CGCTAAAGGC TTATGCCTGA

Protein sequence

MPVIAGDILF DKVRKVYGRV TALQQLDLKV EAGERLVLLG PSGCGKTTAL RLVAGLERVT 
SGKLYLNGRL ANNLEPGERD VAMVFQNYAL YPHMTVWENI AFGLQVRRVA KEEIKARIKE 
ALAILGLEGL EERRPRELSG GQRQRVALAR AIVKQAPYFL LDEPLSNLDA QLRTQARSEL 
VRLHRKLNST MIYVTHDQVE AMTIGQRIAI LAGGVLQQVD TPENIYNRPA NTFVAKFIGN 
PPMNLLPGIV KGNQLFLGEG LKLIIPGNWS AWLLGKSQSK VIMGLRPEDV TLREEGVAEG 
EGLPVRITWR ENCGKERLYY LAAGDKELIA SFSEGRTEPR GGELWLTIDW NKVHFFTEGN 
GNSLGYPWNT RELSLKAYA