Gene Moth_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1863
Symbol
ID	3831494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1924905
End bp	1925963
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	63%
IMG OID	637829795
Product	cobalt transport protein CbiM
Protein accession	YP_430706
Protein GI	83590697
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0310] ABC-type Co2+ transport system, permease component
TIGRFAM ID	[TIGR00123] cobalamin biosynthesis protein CbiM

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.292788
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCATATTC CCGACGGTTA CTTAAGTCCC CAGACCTGTG CGGTACTGGG TGCGGCCATG 
GTGCCTGTGT GGGGCACGGC CGCCCGCAAG GTCAAAGCCA CCCTGAAGGC CAGGCAGGCT 
CCCCTCCTGG CCATCGGCGC CGCTTTTTCC TTCACTATCA TGATGTATAA TATCCCCATC 
CCCGACGGGA CGACGGCCCA CGCCACCGGC GGCGCCCTAT TAGCCATCCT CCTGGGCCCG 
TGGGCGGCGG CTATCGGCAT CTCTATCGCC CTGGCCATCC AGGCCCTTTT CTTCGGCGAC 
GGCGGCATCC TGGCCTTCGG CGCCAATGCC TTTAATATGG CCTTTATCCT TCCCTTCGCC 
AGTTACTACA TCTATCGCCT CTTATCCGGC CGGACAAGCC TGCACTCCGG CTGGCGGGCC 
GTGGCGGCCG CCATCGCCGG GTTTGTCGGC CTTAACCTGG CCGCCCTGGC CGCAGCGGTG 
GAATTCGGCC TGCAACCCCT CCTCTTCCAT ACGGCCAGCG GTGTTCCCCT CTACAGCCCC 
TACCCCCTGG CCTTAGCCGT CCCGGCCATG GCCCTGGCCC ACGTCCTGAT AGCCGGGCCG 
GCCGAAGGAA TAGTCACCGG CCTGGTTATT CGCTACCTGC AGCGGGTTAA TTCCGGTCTG 
CTGCGGGTTT ACCCGGCGAC AGGAGCTGTG GTGGCAGCTC AAGCGACGGG TGACGGTGCC 
AGCCTTAAGA AACTGGCCTG GGGGTTGGTT ATCCTCGTCC TGTTATCCCC CCTGGGGTTG 
CTGGCTGCCG GTACCGCCTG GGGCGAGTGG TCACCGGAAG ACCTGCAACA AATCCTCGGT 
TTCGTTCCCC CGGGTCTGGC CCGCCTGGCT ACCACCTGGA CTCATGCCCT TTTCCCGGAT 
TATACCGTCC CGGGCCTGGA GGGGAGCTTT TGGGCCCAGG CCCTGGGTTA TATCATCACC 
GCCATGGTTG GGCTGGGCAT AATCTTCCTT ATCTTCCTGG CTTTTAACCG GCTCCTGGCC 
CGGCCGGGGA AGACAGGAGC CGATTATCAT GGCAAATAA

Protein sequence

MHIPDGYLSP QTCAVLGAAM VPVWGTAARK VKATLKARQA PLLAIGAAFS FTIMMYNIPI 
PDGTTAHATG GALLAILLGP WAAAIGISIA LAIQALFFGD GGILAFGANA FNMAFILPFA 
SYYIYRLLSG RTSLHSGWRA VAAAIAGFVG LNLAALAAAV EFGLQPLLFH TASGVPLYSP 
YPLALAVPAM ALAHVLIAGP AEGIVTGLVI RYLQRVNSGL LRVYPATGAV VAAQATGDGA 
SLKKLAWGLV ILVLLSPLGL LAAGTAWGEW SPEDLQQILG FVPPGLARLA TTWTHALFPD 
YTVPGLEGSF WAQALGYIIT AMVGLGIIFL IFLAFNRLLA RPGKTGADYH GK