Gene NATL1_00611 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00611
Symbol	dadA
ID	4780671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	67001
End bp	68104
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	40%
IMG OID	640083324
Product	putative thiamine biosynthesis oxidoreductase
Protein accession	YP_001013890
Protein GI	124024774
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.741936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTCT TAAATGAAAA ACCATTGTTA ATCCTCGGAG GAGGATTAAT GGGTCTTGCC 
ATAGCCCATG AACTTGCTAA AAGAGGCAAA CGAGTAGAAG TTTTAAGTAG AAGCAGACGT 
GAAGCAGCAG GCTTTGTTGC TGCTGGAATG CTCGCCCCTC ACGCTGAAGG GCTTCAAGGT 
AATCTTTTAA ATCTTGGTAA AAGTAGTCTT CAAAGGCACT CAACATGGAT AGAAAACATT 
GAGACAAATA GCAAAATGTC ATGTGGTCTC AAAACTTGCG GGATTGTTGT CCCATTTGAA 
AGCCACAAAG ACTGTGAATC CTATCCAACA TATAAATTTG GTAAAAAGCT AAACAGAATT 
GAGCTCCTTC AAGAAGTTCC GAGACTCTCA GAAAAATGGA AACTAGGTTT ACTTTTTAAG 
CAAGACGGCC AAATCGATAA TCGAAGACTT TTAATGAGAG CACTTGAAAA AGCTTGCTTT 
GAATTAGGTG TTCACTTTCA AGAAGGAGTT GAAGTGGTTG AAATAATGAA AGGTCTAAAC 
AAATTTAATG GGGTCAAAAT CAAAGACATT AATGGAAATA TCAATCATTT AAAAAGTGAA 
GAGGCTGTTC TCTGCTGCGG AGCCTGGAGC AAACAAATTT TTAAAACATT GCCTATTTTT 
CCTGTTAAAG GCCAGATGTT ATCTATTCAG GGTCCAAAAC AGATTCTTAA AAGAATTGTT 
TTTGGACCTG GCATTTACTT AGTGCCAAGA GATGACGGTT TAATAATCGT AGGGGCAACT 
AGTGAGCCTG AGGCAGGCTT CCAGACAGGA CTCACTCCAA ATGGGCAAAG CGAGCTTCAA 
AAAGGAATTC AATCTCTTAT TCCTGAACTT AATCAACTAC CTCATATGGA GAGATGGTGG 
GGTTTTCGTC CATGCACACC CGACGAAGGT CCCTTACTGG GAATGTCATC AATTAATGGA 
CTCTGGCTTG CTACTGGGCA TCATCGCAAT GGAGTTCTAT TGGCAGCGAT AACTTCAGAA 
TTAATTGGAA AATCAATTTG CTCAACTCCT TTAAGTAATG AGGAAGATAG TTTGTTGTCC 
CATTTCAGAT GGGACAGATT TTAA

Protein sequence

MGVLNEKPLL ILGGGLMGLA IAHELAKRGK RVEVLSRSRR EAAGFVAAGM LAPHAEGLQG 
NLLNLGKSSL QRHSTWIENI ETNSKMSCGL KTCGIVVPFE SHKDCESYPT YKFGKKLNRI 
ELLQEVPRLS EKWKLGLLFK QDGQIDNRRL LMRALEKACF ELGVHFQEGV EVVEIMKGLN 
KFNGVKIKDI NGNINHLKSE EAVLCCGAWS KQIFKTLPIF PVKGQMLSIQ GPKQILKRIV 
FGPGIYLVPR DDGLIIVGAT SEPEAGFQTG LTPNGQSELQ KGIQSLIPEL NQLPHMERWW 
GFRPCTPDEG PLLGMSSING LWLATGHHRN GVLLAAITSE LIGKSICSTP LSNEEDSLLS 
HFRWDRF