Gene NATL1_20471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_20471
Symbol	lldD
ID	4779909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1690320
End bp	1691516
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	41%
IMG OID	640085341
Product	L-lactate dehydrogenase (FMN-dependent) and related alpha-hydroxy acid dehydrogenases
Protein accession	YP_001015867
Protein GI	124026752
COG category	[C] Energy production and conversion
COG ID	[COG1304] L-lactate dehydrogenase (FMN-dependent) and related alpha-hydroxy acid dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.819941
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGGAG CAGATGTTTC CTCTCCTGGG GTACTTAATA TTGATGACCT CAGGTCTAGA 
GCTAAAAATC GTCTGCCGGC GATGGTTTTT AACTATATAG ATAGTGGTGC AGATAGAGAA 
CAAACACTTT CGCAAAATTG CAACGCATAT AATGAAATTT TATTTAGACC TAGATGTGCA 
GTTTCTGTTC CATCGTGTGA GCTTGGAATA TCTGTTTTAG ATCAGCAATT TCAACTTCCT 
TTCTTGTTGG GACCAGTAGG GAGTAGCAGA ATGTTCTATC CTCAAGGAGA AGTTGTTGCA 
GCTAGAGAGG CAGGAAAAGC TGGAACTGGA TATACCTTGT CGATTCTCTC AGGTTGTTTA 
TTAGAAGACG TTAAAGCTGC TACAAACGGA CCAGCTTGGT ATCAGCTTTA TTTACTTGGT 
GGTAAAGAAG TCGCTTTAAA AACAATTGCT AGAGCTAAAG AAGCTGGATT CTCAGCAATA 
GTTGTAACTA TTGATACACC CGTATCTGGT TTGAGGGAAA GAGATATGCG ATCAGGAACC 
CAACAGCTTT TATCAATGAA TCCTTTGGAG ATGCTTCCTT ATATTCCTCA AATATTAGTT 
AAACCATGCT GGATGACTCA ATGGTTAAGT GATGGAGGCT TAATGAGTTT TCCTAATGTT 
CAACTAGATG ATGGCCCTAT GGGATACACG GCAATTGGTC CTGCTTTAGA GCAATCAGTG 
GTTACTTGGG ATGATCTTCA ATGGATAAGA GAAGCGTGGG GTGGAAAAAT TATTGTTAAG 
GGTATACATA TTGGCGATGA CGCAAAAAAA GCGGTAGAGC TAGGGGCTGA TGCGATCGTT 
ATTTCTAATC ATGGAGCCAG GCAACTTGAT AGCGTTGCTC CCACGATCCG TGTTTTGCCC 
GAAATTTTAG CTGCAGTTGA TGGGAAAATA GATGTGTTGC TAGATGGAGG TATTCGCAGG 
GGTAGTGATG TTGTTAAAGC ATTATGTCTT GGAGCGAAAG GAGTTTTGAT CGGTAGAGCA 
TATGCGTATG GACTTGCTGC TGCAGGAGGG AAAGGCGTTG CCAGAGCTAT AGAAATTCTT 
CAAACAGATA TAGTGAGAAC TATGAAACTA TTGGGATGTG GGTCTGTTGC CGATTTAAAT 
AAATCTTATA TTCAAGTTCC TGAAAGTTGG GAGAGATTCG AAAAAATCTT TGATTGA

Protein sequence

MLGADVSSPG VLNIDDLRSR AKNRLPAMVF NYIDSGADRE QTLSQNCNAY NEILFRPRCA 
VSVPSCELGI SVLDQQFQLP FLLGPVGSSR MFYPQGEVVA AREAGKAGTG YTLSILSGCL 
LEDVKAATNG PAWYQLYLLG GKEVALKTIA RAKEAGFSAI VVTIDTPVSG LRERDMRSGT 
QQLLSMNPLE MLPYIPQILV KPCWMTQWLS DGGLMSFPNV QLDDGPMGYT AIGPALEQSV 
VTWDDLQWIR EAWGGKIIVK GIHIGDDAKK AVELGADAIV ISNHGARQLD SVAPTIRVLP 
EILAAVDGKI DVLLDGGIRR GSDVVKALCL GAKGVLIGRA YAYGLAAAGG KGVARAIEIL 
QTDIVRTMKL LGCGSVADLN KSYIQVPESW ERFEKIFD