Gene NATL1_21851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_21851
Symbol
ID	4779371
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	1845347
End bp	1846459
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	30%
IMG OID	640085483
Product	NAD binding site:D-amino acid oxidase
Protein accession	YP_001016005
Protein GI	124026890
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.594182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAATGA ATAGCCAAAA AACAGAAAAA AAACACACCG AAATCTCAAT TGTTGGAGGT 
GGGATAGCAG GAATTACAAC TGCCTTTCAT TTAGGGAAAA AAGGTTATCA AATAAATTTA 
ATCGACCCAA CATTAAATTC AGAAATAAAT AATTTAAATC CAAAAAATGG AACACAAGCT 
AGTTTGGGTG TTCTCATGGG AAATATCTAC AAAAGATCAA AAGGAAGAGC TTTTTTACTA 
AGAAAAAAAA GTATGAAATT ATGGAAAGAA TGGCTTACAC AAATAAACTA TTCTGAGACA 
GATTTGATTC TTGAAAAACC ATTAATTAAA TTAGCAAGTT CAGACAAAGA GTATCAATCA 
ATGATTGAAT TAAGTCATAA TAAAAAAACT TATGGAATTG AACTTTTAGA TCAAAATTCT 
TTAGATTTCT GGAATTCTAT ATTTGAGACA AGATTAATAG GGGGATTAAT ATCTCATGAA 
GATGGTCGAT TAAATCCAAT AAAGTTAATC AAGTCATTAA TGGAAAGTCT TGATCAAATC 
AAGATAAATA AAATCGAGAA AAGTGTTATT AGAATAAGTA AAAATAATAA TTTAAATGAT 
AAAAGCTGGA CTATTAATCT TGAAAATAAT CAATCTATTA ATCAAGATTA TATCATCATT 
TGTTCTGCAT TAAATACTCA AAATTTATTA AAACCATTAG GTCATGAAAT ACTTTTAGAA 
CCAATATTAG GACAAGTTAT TGAATTAGAA TTAAAAAAAG AAACTCCGAA TTGGAAAGAA 
TGGCCTGCAA TATTAAATTA TCAATCTATA AACTTTATAC ACCATGATCC CAATCGCATG 
CTTATAGGAG CAACTGTCGA AAAAGGAACT AAACCAAGCC AATTAGATAA ACAAAAAATG 
CTGAACCTGA GAAACGGTTC TCCAAAATGG ATGCTCAATG CAAAAGTCTG TCATGAATGG 
AGCGGAATAA GAGCTAGACC AACTAATGAA GCAGCTCCCT TATTAAAACA ACTAGAACCA 
GGTCTATTAA TTAATACAGG TCACTACAGA AATGGTGTTT TATTAGCTCC TGCTTGCGCC 
GAATGGATAG GACTTCAAAT TGAGGGCCAA TAA

Protein sequence

MQMNSQKTEK KHTEISIVGG GIAGITTAFH LGKKGYQINL IDPTLNSEIN NLNPKNGTQA 
SLGVLMGNIY KRSKGRAFLL RKKSMKLWKE WLTQINYSET DLILEKPLIK LASSDKEYQS 
MIELSHNKKT YGIELLDQNS LDFWNSIFET RLIGGLISHE DGRLNPIKLI KSLMESLDQI 
KINKIEKSVI RISKNNNLND KSWTINLENN QSINQDYIII CSALNTQNLL KPLGHEILLE 
PILGQVIELE LKKETPNWKE WPAILNYQSI NFIHHDPNRM LIGATVEKGT KPSQLDKQKM 
LNLRNGSPKW MLNAKVCHEW SGIRARPTNE AAPLLKQLEP GLLINTGHYR NGVLLAPACA 
EWIGLQIEGQ