Gene A9601_00481 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_00481
Symbol	dadA
ID	4716730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	51387
End bp	52496
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	32%
IMG OID	640077745
Product	putative thiamine biosynthesis oxidoreductase
Protein accession	YP_001008443
Protein GI	123967585
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.254103
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACAAG AAACCAAAAA TTCAATATTA ATCATTGGAG GTGGACTTTT AGGTTTATCT 
ATTGCTTATG AATTTTCAAG AAATAGCTTC AAAGTTTTAG TTTTAAGCAA AAACAGAAAT 
GAATCAGCTG GATTTGTTGC TGCAGGAATG TTAGCTACTC ATGCTGAAGG GCTCGAAGAT 
GAATTACTAA AATTTGGCCA AGAAAGTCAA AATCTAATTC CAAAGTGGAT ACAAAGTATT 
GAACAAGATA GTAATATTAA ATGCGGTTTA AAAAAATGTG GCATTGTAGT TCCTTTTAAA 
AACAAAGAAG ATCTTGAAGC GTTTCCCACT TATGAATATG GAAAATATTT AAATCACAAA 
GATCTTCAAA CAGAAATCAA TGGAATGAAT TCTATTTGGA AACATGGTTT ACTTTTTGAA 
CAAGATGGTC AAATAGATAA CCGAAGAAAA CTGATGCGTG CTCTTGAGAG AGCATGCTCC 
TTGAATGGAG TCGAATTTCA AGAAGGATCA GAAGTAGAGG ATTTAACATT CGAAAAAAAC 
AAAATTACAG GTGCAACAGT TTTATGTGCC ACTGGGGAAA TAAAAAAAAT TAACTGCGAA 
AAAGCAATTA TATGCAGCGG TGCGTGGAGT AAAAAAATTT TTAAAAAAAT TCCAGTCTTT 
CCTGTAAAGG GACAAATGCT ATCAATACAA GGTCCAACAA ATTTTTTAAA AAGGGTTATT 
TTTGGTCCAA AAACTTATCT AGTACCCCGT GATGATGGAC TTATTATAGT TGGAGCGACA 
GTTGAAAAAG ATTCAAAATT TAATCAAGGT AATACTCCTA ATGGAATAAA ACAACTGCAA 
GAAGGCATTC GCTCTTTATT GCCAGAAGCT ATTAATTGGC CACAAATGGA ACATTGGTGG 
GGCTTTAGAC CTTGCACACC AGATCTAAAA CCAATAATTG GAAAATCAAA AATTGAAAAT 
CTTTATATAG CTACAGGACA TTACAGAAAT GGAGTTTTAT TTTCTGCAAT AACAAGTGAT 
CTTCTTTTGA AAATAGTTCA AAATAAAAAT CTCAAAGAAA TAGAGAAAAG CTTTTTAGAA 
AAATTTAGTT TAGATAGATT TGCGATTTAA

Protein sequence

MAQETKNSIL IIGGGLLGLS IAYEFSRNSF KVLVLSKNRN ESAGFVAAGM LATHAEGLED 
ELLKFGQESQ NLIPKWIQSI EQDSNIKCGL KKCGIVVPFK NKEDLEAFPT YEYGKYLNHK 
DLQTEINGMN SIWKHGLLFE QDGQIDNRRK LMRALERACS LNGVEFQEGS EVEDLTFEKN 
KITGATVLCA TGEIKKINCE KAIICSGAWS KKIFKKIPVF PVKGQMLSIQ GPTNFLKRVI 
FGPKTYLVPR DDGLIIVGAT VEKDSKFNQG NTPNGIKQLQ EGIRSLLPEA INWPQMEHWW 
GFRPCTPDLK PIIGKSKIEN LYIATGHYRN GVLFSAITSD LLLKIVQNKN LKEIEKSFLE 
KFSLDRFAI