Gene TM1040_3751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3751
Symbol
ID	4075458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	808645
End bp	809904
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	65%
IMG OID	638005271
Product	molybdopterin biosynthesis protein MoeA
Protein accession	YP_611980
Protein GI	99078722
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGA CCCCGCCGCC CCTCAGCAAT GACTGTTTTG CCTTGCCGCA AGGGGTGGAT 
TGGACCCCGG TGGATCAGGC TCTTGCCCTG CTGCAAGAGC GCCTTGGGCC GGTGACGTCG 
GCGGACACCG TGTCGCTCTC CGAGGCGCTT GGTCGGGTGC TGGCCGAGGA TGCCGTGGCG 
CTCAGGTCCA ACCCACCGCA ACCCAACACG GCGGTTGATG GGTATGGATT TTCGGGTGGA 
CGCCCGGAGG GGGCGCAGGT GCTACCCCTT CAGGAGGGGC GCGCCGCAGC CGGGGTGCCC 
TATGGAGGAA CTGTGCCTCA AGGGCATGCC CTCCGAATTC TAACGGGTGC GGCACTCCCC 
GAAGGTGTTG ATACCGTCGT GTTGGAAGAA GACGTTCGCA CCGATGGTCA GTCGATCGCC 
TTCAACGGAC CGCTCAAGCA GGGGGCCAAT ACGCGCAAAG CGGGCGAAGA TGTGAACGCT 
GGCGAGGTGA TATTGCGCAG GGGGCGCGTC CTGACGCCTG CGGATCTCGC GCTGACATCT 
GCAACGGGGC TTAACAGTCT GGTGGTGCGC CAGCGCCTGA GAGTCGCGGT GATTTCCACC 
GGCGATGAAC TGGTCGAGCC GGGGCAGGCC GCGCGAGACG GGCAAATTTA TGACGCCAAC 
CGTCCGATGC TGTTGGCGCT GATGCAGCAG TTTGGATTTG CCACGGTCGA CATGGGGCGC 
ATCCAGGATG ATCGCGCAGC GCTCGCAGCA GCGCTGGATC AGGCGGCTGC ACAGGCGGAT 
GTGATTCTGA CCAGTGGCGG CGCGTCCGCG GGGGACGAGG ATCATGTCTC GGCCCTTCTG 
CGCGAATCTG GCGCCATGCA GGAATGGCGC ATTGCCCTGA AACCGGGACG TCCACTGGCG 
CTTGGGATGT GGCAGGGCAC GCCCGTCTTT GGCCTGCCGG GCAACCCTGT TGCCGCCTTG 
GTCTGTACGC TTGTCTTTGC ACGCCCCGCG ATGGGCCTTC TGGCGGGGGC GGGCTGGTCT 
GAGCCGCAAG GATTTGAGGT GCCAGCCGCG TTCTCCAAGC GAAAGAAACC GGGGCGGCGA 
GAATACCTGC GCGCGCGCAT GCGGTCGGGA TGTGCGGAGG TGTTCAAATC CGAAGGCTCA 
GGCCGGATTT CGGGCCTCAG CTGGGCCGAG GGGCTGGTAG AGTTGCCTGA TGGGGCGATG 
GATGTCGCGC CGGGAGATCC TGTGCGATTT ATTCCCTTCG CCAGCTTTGG CATGAGCTAA

Protein sequence

MTLTPPPLSN DCFALPQGVD WTPVDQALAL LQERLGPVTS ADTVSLSEAL GRVLAEDAVA 
LRSNPPQPNT AVDGYGFSGG RPEGAQVLPL QEGRAAAGVP YGGTVPQGHA LRILTGAALP 
EGVDTVVLEE DVRTDGQSIA FNGPLKQGAN TRKAGEDVNA GEVILRRGRV LTPADLALTS 
ATGLNSLVVR QRLRVAVIST GDELVEPGQA ARDGQIYDAN RPMLLALMQQ FGFATVDMGR 
IQDDRAALAA ALDQAAAQAD VILTSGGASA GDEDHVSALL RESGAMQEWR IALKPGRPLA 
LGMWQGTPVF GLPGNPVAAL VCTLVFARPA MGLLAGAGWS EPQGFEVPAA FSKRKKPGRR 
EYLRARMRSG CAEVFKSEGS GRISGLSWAE GLVELPDGAM DVAPGDPVRF IPFASFGMS