Gene P9303_30031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_30031
Symbol
ID	4778021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	2657411
End bp	2658529
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	55%
IMG OID	640088527
Product	NAD binding site:D-amino acid oxidase
Protein accession	YP_001018998
Protein GI	124024691
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.549053
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCATTGCT CGTCAATATC AAGAATGACT GCTTCCACCG TTGCAATCAT TGGTGCCGGT 
GCGGTTGGCG CTGGCACAGC CTGGTATTTA GCCAAGCATG GCCACCAAGT GATGCTGATT 
GATCCAAAAC TGGATCAACC GATTAACCGA TCAGGGGCCC TCCCGGGAAC AACTGCTTCG 
CTAGGGGTAC TCATGGGGCA TGTTTTCAGG CGCAGCAGTG GACGAGCCTG GCGACTCCGA 
CAACACAGCA TGACCCTCTG GCCAGAGTGG GTTGCAGAAC TGAGCAGTCA AGAGCATCCG 
CTCAAGCTCA ACACGCCTCT GATTCAACTT GCGAGTAGCG AAGCAGAAGC CACCCTGATG 
AAGCAACTCA CAGAACAACG GCAACATCTG GGCCTTGAGC TGATCTCACC AAACTCGAAT 
CCCTGCATGG GCCGATCATG GCCAAACACC CAACATGGGG GCCTGATCTC TCATCAAGAC 
GGTTATCTAG ACCCGATCGC CCTACAACAA TGCCTACGGG CCGCCCTACA AGACCAAGGC 
GTACAACAAA TCCAAGAGCC AGTTGTCTCG CTGGAACGAA ATTCATCTGT CGAAGAAAAA 
CAGTGGCGCC TTCAACTTGC AGGAGGAACG AATTTGAACC AAGACGCTGT CGTGATCTGT 
GCAGCACTTG GCAGCGAAGC CCTGCTGGAA CAACTAGGCC ACAGTCTTCC CATGGCCCCT 
GTGCTTGGAC AAGTGCTGGA TCTAGAGGTG ATCTCAGATC AGCACAATTG GAGCGGCTGG 
CCTGCAGTAC TCGTGAGCCA TGGCATCAAC CTGATCCCCC ACGGACCCAA TCAGATCTGG 
ATAGGTGCCA CTCTCGAGCC AGGAGTGCAA CCAATAGCGA GCCACCTAAA GGCCATGCAA 
CACCTCGAGG GAGATGCCCC GGATTGGTTA GAAAGCGCGA CTGTGAAAGA CCAATGGCAT 
GGATTGCGCG CTCGACCTGT CGAACGTCCA GCACCTCTTT TAGAAAAACT AGAGCCCGGG 
CTAATCGTGG CTACAGGCCA TTACCGAAAT GGCGTCTTGC TCGCCCCGGC CAGCGCTGCA 
TGGGTCAAAG AGCAACTCAC TAACGAGACA AGATCTTGA

Protein sequence

MHCSSISRMT ASTVAIIGAG AVGAGTAWYL AKHGHQVMLI DPKLDQPINR SGALPGTTAS 
LGVLMGHVFR RSSGRAWRLR QHSMTLWPEW VAELSSQEHP LKLNTPLIQL ASSEAEATLM 
KQLTEQRQHL GLELISPNSN PCMGRSWPNT QHGGLISHQD GYLDPIALQQ CLRAALQDQG 
VQQIQEPVVS LERNSSVEEK QWRLQLAGGT NLNQDAVVIC AALGSEALLE QLGHSLPMAP 
VLGQVLDLEV ISDQHNWSGW PAVLVSHGIN LIPHGPNQIW IGATLEPGVQ PIASHLKAMQ 
HLEGDAPDWL ESATVKDQWH GLRARPVERP APLLEKLEPG LIVATGHYRN GVLLAPASAA 
WVKEQLTNET RS