Gene Saro_3304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3304
Symbol
ID	3915951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3522575
End bp	3523831
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	66%
IMG OID	640446089
Product	aspartate kinase
Protein accession	YP_498573
Protein GI	87201316
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0250326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCCGCA TCGTGATGAA ATTCGGCGGC ACTTCGATGG CCGGCACCGA GCGCATCCGC 
CGCGTGGCGC GCATCGTGCA GCGCCAGCAG GCGGCAGGGC ACGAGGTGGC GGTGGTCGTC 
TCTGCCATGG CGGGCGAGAC CGACCGCCTC GTCAACTTCT GCCGCGAGGC GAACCCGCTC 
TACGATCCGG CCGAATACGA CGTGGTCGTG GCCAGCGGCG AGCAAGTGAC GTCGGGTCTC 
CTGGCGATGC ATCTCCAGGC GCTGGGCTGC AAGGCGCGCT CGTGGCTGGG ATGGCAGCTG 
CCGATCCACA CCGACGACGC GCATTCGAAG GCGCGCATCG AAGGCATCGA TTCGGAAGCG 
CTGCTTGCCA GCATGGGCGC GGGCGAGATC GCGGTGATCC CGGGATTCCA GGGCCTTACC 
GCCGACAACC GCGTGACCAC CCTGGGCCGT GGCGGTTCCG ACACTTCGGC CGTGGCAGTG 
GCGGCGGCGG TCAAGGCCGA CCGTTGCGAC ATCTACACCG ACGTGGACGG GGTCTACACC 
ACCGATCCGC GCATCGTGGC CAAGGCCCGC AAGCTCAAGA ACGTGACCTA CGAGGAAATG 
CTCGAACTGG CCTCGGTCGG CTCGAAGGTC CTGCAGACCC GCTCGGTCAG CCTTGCCATG 
AAGGAAGGCG TGCGCGTGCA GGTGCTTTCC TCATTCATCG ACGACGACGC CCCGGCGGCG 
GACACGATCC CCGGCACGAT GATCGTTTCC GACGAGGAAC TTGAAGGATT GGATATGGAA 
CGCCAGCTGA TCACCGGCAT CGCCGCCGAC AAGAACGAGG CGAAAGTTAC CCTGACCCGC 
ATCGCGGACC GCCCCGGCGC GGTCGCGGCG ATCTTCGGCC CGCTGGCCGC GGCGAACATC 
AACGTCGACA TGATCATCCA GAACATCGCC AAGGACAAGG GCGAGACCGA CGTCACCTTC 
ACGGTTCCGA TCTCGGACCT CGCCCGTACC CAGGCGCTGC TTGAAGAGCG CAAGGACACG 
ATCGGCTACT ACCGCATGCT GGCCAACAGC AAGGTCGCCA AGATCAGCGT CGTCGGCGTC 
GGCATGCGCA GCCACGCCGG CGTCGCCAGC ACCATGTTCC GCGCCCTGGC CGACCGCGGC 
ATCAATATCC AGGCGATCAC CACCAGCGAG ATCAAGGTCT CGGTGCTGAT CGACGAGGAC 
GAGACCGAAC TCGCGGTGCG CGTGCTGCAC ACCGCCTACG GCCTCGACGG CGAGTAA

Protein sequence

MARIVMKFGG TSMAGTERIR RVARIVQRQQ AAGHEVAVVV SAMAGETDRL VNFCREANPL 
YDPAEYDVVV ASGEQVTSGL LAMHLQALGC KARSWLGWQL PIHTDDAHSK ARIEGIDSEA 
LLASMGAGEI AVIPGFQGLT ADNRVTTLGR GGSDTSAVAV AAAVKADRCD IYTDVDGVYT 
TDPRIVAKAR KLKNVTYEEM LELASVGSKV LQTRSVSLAM KEGVRVQVLS SFIDDDAPAA 
DTIPGTMIVS DEELEGLDME RQLITGIAAD KNEAKVTLTR IADRPGAVAA IFGPLAAANI 
NVDMIIQNIA KDKGETDVTF TVPISDLART QALLEERKDT IGYYRMLANS KVAKISVVGV 
GMRSHAGVAS TMFRALADRG INIQAITTSE IKVSVLIDED ETELAVRVLH TAYGLDGE