Gene A9601_18631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_18631
Symbol	asd
ID	4718601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	1596868
End bp	1597899
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	34%
IMG OID	640079597
Product	aspartate semialdehyde dehydrogenase
Protein accession	YP_001010253
Protein GI	123969395
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0136] Aspartate-semialdehyde dehydrogenase
TIGRFAM ID	[TIGR01296] aspartate-semialdehyde dehydrogenase (peptidoglycan organisms)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0915019
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGACAAT TTCCTTATTT GCCTAATAGG CCATTAAAAG TTGCTGTTTT AGGTTCTTCA 
GGTGCTGTGG GATCTGAATT GCTAAAAATT CTTGAACAAC GTGATTTCCC AATATCAGAA 
TTGGTCTTGC TTTCATCAGA GCGGTCAGAA GGAAAAAAAA TTATTTGGAA AGGTGAAGAA 
CTAGTTACAA AAAAAACAAC TAAGGAAGAA TTTAAGAATC TTGATCTAGT TTTGGCGTCA 
GCTGGCGGAA GTATTTCAAA AAAGTGGTTA TCTACCATTA TTGATCAAAA TGCTTTACTG 
ATAGATAATT CAAGTGCTTT CAGATTAGAT AAGAACGTTC CTCTTATAGT CCCTGAAGTT 
AATGCTAGTG ACGTACTTAA TCATGATGGG GTAATAGCCA ATCCAAACTG CACTACCATT 
TTGTTGACAT TAGTTTTAGC TCCATTAAAC AAACTTTCTA CTATTCAAAG AGTTATTGTC 
TCAACATATC AATCTGTCAG TGGTGCAGGC CAACTGGCGA TGGAGGAACT AAAACTTTTA 
ACTGAAAAAT ATCTTCAAGG AAATCCTCAA AAAAGTGAAG TTTTGCCATA CTCCCTTGCT 
TTTAATTTGT TTTTACATAA TTCTCCTATG CTTTCAAATA ATTACTGCGA AGAAGAGATG 
AAAATGGTTA ATGAGACAAG GAAAATATTA AATATTGCTG ATTTAAAGCT CTCTGCTACA 
TGTGTTCGAG TCCCAGTTCT AAGAGCACAT TCTGAATCGA TCAACATTGA ATTTGCCGAT 
GTAGTTGAGC CTAAAGAAGC TCTTGAAGAA TTAAAAAAAT CTCCTGGAAT TGAAATTATT 
GAGGATTACA AAAATAATAG ATTTCCTATG CCAAATGACG TTATGGGAAG GGATAATATT 
GCTGTTGGCA GGCTAAGAAC TGATATAAGT CATCCTCATG GATTAGAATT ATGGTTATGT 
GGAGATCAAA TAAGAAAAGG AGCAGCTCTG AATGCTGTTC AAATAGCTGA GTTATTAATT 
CCAAAAAAAT GA

Protein sequence

MRQFPYLPNR PLKVAVLGSS GAVGSELLKI LEQRDFPISE LVLLSSERSE GKKIIWKGEE 
LVTKKTTKEE FKNLDLVLAS AGGSISKKWL STIIDQNALL IDNSSAFRLD KNVPLIVPEV 
NASDVLNHDG VIANPNCTTI LLTLVLAPLN KLSTIQRVIV STYQSVSGAG QLAMEELKLL 
TEKYLQGNPQ KSEVLPYSLA FNLFLHNSPM LSNNYCEEEM KMVNETRKIL NIADLKLSAT 
CVRVPVLRAH SESINIEFAD VVEPKEALEE LKKSPGIEII EDYKNNRFPM PNDVMGRDNI 
AVGRLRTDIS HPHGLELWLC GDQIRKGAAL NAVQIAELLI PKK