Gene NATL1_00561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00561
Symbol
ID	4779997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	57836
End bp	59338
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	37%
IMG OID	640083319
Product	flavoprotein
Protein accession	YP_001013885
Protein GI	124024769
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0426] Uncharacterized flavoproteins [COG1853] Conserved protein/domain typically associated with flavoprotein oxygenases, DIM6/NTAB family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGTGA AATATAAAAA TTTAACGGTT ATTTGTTCTA ATCCAGGAGC AAAATTATTC 
AAAGAGATTT GGAATTTACG AAAACCCTCG CAAAATACAA ATCCTAAAGA AGCATTGGAG 
ACAGTTGAAG TTCTTCCAAA TATACAAATC ATCAAACAAT TAGAAACTCA TACACTTAAC 
AGTAATTTTG AAGTTACGTA CATTCCCGCG CCAACAGCTC GCTGGCCTGG TGGACTAATT 
GTTTTTGAAA AGCAAACTGG TTTATTGATG AGTGATAAAT TATTCGGTGC TCATGTTTAT 
GAAGAAAAAT GGGCTGAATT AACCAGTAGT AGCACGGAAG AAGAGAGAAG ACATTACTTC 
GATTGTCTAA TGGCGCCAAT GTCTACCCAA GTCAATAGTA TTATCGAAAA ATTTGAAGAC 
TTTGAGATTG ATACGATAGT ACCCGGACAT GGACCTGCAA TCAGCGGTAG TTGGAGGAGT 
TTATTAAACA ACTACCAAAG CTGGGGAGAA AGCCAAAAAT ACAGCAACTT AAGAGTTGCT 
CTATTATTTG CAAGTGCATA TGGAAATACT GCTGCTATTG CTGATGCCAT TGCTAGAGGA 
ATTAGTAAAA CAGGGGTCAA CGTTAAGATT ATTAATTGTG AATTCACCGC ATCAGATAGC 
TTAGTCACTG AAATTCGTAA AGCAGACGGA TATTTAATTG GATCGCCAAC ATTAGGAGGG 
CATGCACCCA CCCCGATTGT TTCAGCACTT GGCTCGCTTT TGGCTGAGGG AGATAGAGGA 
AAGCCGGCTG GAGTATTTGG AAGTTATGGA TGGAGTGGGG AAGCTCTTGA TTTGCTTGAA 
AAAAAATTAA AAGATGGAGG TTTTAAATTT GGATTCGAAC CTATCAAAAT TAAATTTAGT 
CCTGACCCTT TAATGATTAA AAAACTTGAA GAAACAGGTA TCCAATTTGG TAAGCAATTA 
ATTAATGCAA AATTACGTCA ACAAAGAAAG GCTAATGTAG GTTTAAATAC AAGTAAAAGT 
GATCCAACAA TTAATGCACT CGGAAGGGTC GTCGGATCAC TATGTATATT GACTGCTCAG 
AAAGGAGATG AAGATAATCT GATTAGCGGA GCTATGGTTG CAAGTTGGGT TAGTCAAGCA 
AGCTTTTCTC CTCCTGGTAT TACTATTGCA GTCGCTAAAG AAAGAGCTGT AGAAAACTTA 
CTTCATACAG GAGATAACTT TGCTCTAAAC ATTTTAGAGC AAAATAATCA CCAAAGCCTC 
CTTAAACAAT TTCTCCAATC ATTCAAACCT GGAGATAATA GATTTACCAA TCTTGAGATT 
AAATTAAGTC CAAGCAATCA GCCATTATTA AACGAAGCTT TAGCCTGGCT GGAGGGTACA 
GTTAGTCAAC GAATGGAGTG TGGGGATCAT TGGCTGATAT ATGCTGAGAT TAAATATGGA 
AAAGTCATTA AAAAAGATGG AGTAACAGCA GTTCATCATC GAAAAACCGG AGCGAACTAC 
TAG

Protein sequence

MNVKYKNLTV ICSNPGAKLF KEIWNLRKPS QNTNPKEALE TVEVLPNIQI IKQLETHTLN 
SNFEVTYIPA PTARWPGGLI VFEKQTGLLM SDKLFGAHVY EEKWAELTSS STEEERRHYF 
DCLMAPMSTQ VNSIIEKFED FEIDTIVPGH GPAISGSWRS LLNNYQSWGE SQKYSNLRVA 
LLFASAYGNT AAIADAIARG ISKTGVNVKI INCEFTASDS LVTEIRKADG YLIGSPTLGG 
HAPTPIVSAL GSLLAEGDRG KPAGVFGSYG WSGEALDLLE KKLKDGGFKF GFEPIKIKFS 
PDPLMIKKLE ETGIQFGKQL INAKLRQQRK ANVGLNTSKS DPTINALGRV VGSLCILTAQ 
KGDEDNLISG AMVASWVSQA SFSPPGITIA VAKERAVENL LHTGDNFALN ILEQNNHQSL 
LKQFLQSFKP GDNRFTNLEI KLSPSNQPLL NEALAWLEGT VSQRMECGDH WLIYAEIKYG 
KVIKKDGVTA VHHRKTGANY