Gene EcHS_A0835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0835
Symbol	moaA
ID	5592046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	843647
End bp	844636
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	54%
IMG OID	640920007
Product	molybdenum cofactor biosynthesis protein A
Protein accession	YP_001457574
Protein GI	157160256
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2896] Molybdenum cofactor biosynthesis enzyme
TIGRFAM ID	[TIGR02666] molybdenum cofactor biosynthesis protein A, bacterial

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.344402
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTCAC AACTGACTGA TGCATTTGCG CGTAAGTTTT ACTACTTGCG CCTGTCGATT 
ACCGATGTGT GTAACTTTCG TTGCACCTAC TGCCTGCCGG ATGGCTACAA ACCGAGCGGC 
GTCACCAATA AAGGCTTTCT TACCGTCGAT GAAATTCGCC GGGTTACGCG CGCCTTCGCC 
AGTCTGGGCA CCGAAAAAGT GCGCCTGACA GGAGGAGAGC CGTCTTTACG CCGCGACTTT 
ACCGATATCA TCGCCGCTGT GCGGGAAAAC GACGCTATCC GCCAGATTGC GGTCACCACC 
AATGGTTACC GTCTGGAACG CGATGTGGCG AACTGGCGCG ATGCGGGACT TACTGGCATT 
AACGTCAGTG TCGACAGTCT GGACGCCCGC CAGTTTCACG CTATTACCGG GCAGGATAAA 
TTCAACCAGG TCATGGCAGG GATTGATGCT GCATTTGAGG CCGGTTTTGA GAAGGTCAAA 
GTCAATACCG TGCTGATGCG TGATGTTAAT CATCACCAGC TCGACACCTT TCTGAACTGG 
ATCCAGCATC GCCCTATCCA GCTGCGTTTC ATCGAACTGA TGGAAACGGG CGAGGGCAGT 
GAGCTCTTCC GTAAACATCA CATCTCTGGT CAGGTTCTGC GTGACGAGCT ACTGCGTCGC 
GGCTGGATCC ACCAATTACG TCAACGCAGC GACGGTCCCG CGCAAGTCTT TTGCCATCCG 
GATTACGCCG GAGAGATTGG CCTTATCATG CCGTATGAAA AAGACTTCTG CGCCACTTGC 
AACCGCCTGC GCGTTTCCTC CATTGGTAAA CTCCATCTCT GCCTGTTTGG TGAAGGCGGC 
GTTAACCTGC GCGATCTGCT GGAAGACGAT GCCCAGCAAC AGGCGCTGGA AGCGCGTATT 
TCAGCGGCGC TGCGGGAGAA GAAACAGACC CATTTCCTGC ATCAAAACAA CACCGGTATT 
ACGCAAAACT TATCGTACAT TGGCGGCTAA

Protein sequence

MASQLTDAFA RKFYYLRLSI TDVCNFRCTY CLPDGYKPSG VTNKGFLTVD EIRRVTRAFA 
SLGTEKVRLT GGEPSLRRDF TDIIAAVREN DAIRQIAVTT NGYRLERDVA NWRDAGLTGI 
NVSVDSLDAR QFHAITGQDK FNQVMAGIDA AFEAGFEKVK VNTVLMRDVN HHQLDTFLNW 
IQHRPIQLRF IELMETGEGS ELFRKHHISG QVLRDELLRR GWIHQLRQRS DGPAQVFCHP 
DYAGEIGLIM PYEKDFCATC NRLRVSSIGK LHLCLFGEGG VNLRDLLEDD AQQQALEARI 
SAALREKKQT HFLHQNNTGI TQNLSYIGG