Gene P9211_00541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_00541
Symbol	dadA
ID	5730187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	58353
End bp	59513
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	41%
IMG OID	641284396
Product	putative thiamine biosynthesis oxidoreductase
Protein accession	YP_001549939
Protein GI	159902595
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAC ATACTTCAGA ACGATTACTA ATTCTTGGAG GTGGTCTCAT AGGGCTCTCA 
ATCGCTCATG AATTAGCAAG CAAAGGACGT AAGGTTGAAA TCTTAAGCAG AAGAAGAAGC 
GAAGCTGCAG GTTTTGTCGC TGCGGGGATG TTGGCTCCAC ATGCAGAAGG GCTTAGTAAT 
CAAATGCTTG AACTAGGTCG CTCAAGTCTC TTGCAAATAC CTGAATGGGT CCAGAAAATT 
GAGACCAATA GCGGAATGAA TTGTGGACTC AGAATGAGTG GAATAGTCGT ACCTTTTTGT 
AATCTTGAAA CCAGAGAGAA GTATCCAACG GCTCGTTTTG GTCAGTCTCT AAATAGACTT 
TCATTAGAAA AAGAAATACC TGGAATAGCC TCTCAATGGG AAACTGGATT ACTGTTTAGT 
GAAGATGGGC AAATAGACAA CCGGCGTCGT TTAATGAGAG CCCTTGAAAA AGCATGCGTG 
GAATTAGGGG TGCACTTTCA AGAAGGTGTA GAAGTCCAAT CTTTAATTTA TAAAGAAAAT 
GTTTTTCAAG GCGTTTATGT ATGTAATGCA TCAGGTCAAG TGGAAGAAAT TTTTGCAAAC 
GAAGCCGTTC TTTGTAGTGG AGCTTGGAGC AATCAACTTT TTAAAGAAGT ACCAATATTC 
CCAGTCAAAG GACAAATGTT TTCTATACAA GGTCCGAAAG ATGCCCTTAA ACGAATCATG 
TTTGGACCAG GAATTTATTT AGTCCCTCGC GAAGACGGCT TAATCATTGT TGGCGCAACA 
AACGAAAAAG AAGAAGGTTT TAATGAAGGT TGTACACCAT ATGGACAAAA TGAATTACAA 
AAGGGAGTGG AGTCTCTTCT TCCTTCAGCA ATGTCTTGGC CACATATGGA GCGCTGGTGG 
GGCTTTAGAC CATGTACACC AGATTTAAAG CCAATTCTGG GAAATTCATC TCTAAATGGG 
CTCTGGCTAG CAACTGGACA TCATCGCAAT GGAGTACTTT TAGCAGCTAT TACATCGGAC 
TTAATTGGAA AATGCTTATG TGATCAACCA TTATCAAATT CAGAAAAAAG TTTATTGCAA 
CAATTTCATT ACACGCGATT CACCAATAGT GAAATTACTA CTCCACTCTC CACAACTGAT 
CTGAAGGGTT CCAATCGCTA A

Protein sequence

MATHTSERLL ILGGGLIGLS IAHELASKGR KVEILSRRRS EAAGFVAAGM LAPHAEGLSN 
QMLELGRSSL LQIPEWVQKI ETNSGMNCGL RMSGIVVPFC NLETREKYPT ARFGQSLNRL 
SLEKEIPGIA SQWETGLLFS EDGQIDNRRR LMRALEKACV ELGVHFQEGV EVQSLIYKEN 
VFQGVYVCNA SGQVEEIFAN EAVLCSGAWS NQLFKEVPIF PVKGQMFSIQ GPKDALKRIM 
FGPGIYLVPR EDGLIIVGAT NEKEEGFNEG CTPYGQNELQ KGVESLLPSA MSWPHMERWW 
GFRPCTPDLK PILGNSSLNG LWLATGHHRN GVLLAAITSD LIGKCLCDQP LSNSEKSLLQ 
QFHYTRFTNS EITTPLSTTD LKGSNR