Gene Saro_1965 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1965
Symbol	pgk
ID	3917281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2083063
End bp	2084250
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	64%
IMG OID	640444713
Product	phosphoglycerate kinase
Protein accession	YP_497239
Protein GI	87199982
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0126] 3-phosphoglycerate kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.159546
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTCA AGACCCTTGA CGACATCGGC GACCTGACCG GCAAGACCGT GCTGGTGCGC 
GAGGACCTCA ACGTGCCGAT GCAGGACGGC GCGGTCACCG ACGACACGCG TCTGCGCGCC 
ACCATCGCGA CGCTGAACGA GCTGTCCGAC AAGGGCGCGA AGGTGCTCGT GCTGGCGCAC 
TTTGGCCGCC CCAAGGGCCA GCCGTCGGAA GAATTTTCTT TGAAGAAGCT CGCTGCCCCG 
CTCGCGCACG TACTGGGCCG TCCGGTCAGC TACATCGACT GGGAAAGCGA CAAGGCCGCT 
GTGGCTGCTC TGACGCCCGG TGCGATTGCC GTGCTTGAGA ACACCCGCTT CTTCGACGGC 
GAGGAAAAGA ACGACCCAGC CGTGATCGAG CGTTTCGCCA GCCTCGGCGA CATTTACGTC 
AATGATGCCT TTTCCGCCGC CCACCGCGCC CACGCTTCGA CCGAAGGCCT GGCACACGTG 
CTGCCGGCCT ATGCAGGCCG CGCCATGGAG GCCGAGCTCA AGGCATTGCA GAAGGCGTTG 
GGGGAACCCG AACGTCCGGT GGCAGCCGTT GTTGGCGGGG CCAAGGTGTC GACCAAGCTC 
GACGTGCTCA AGCACCTTGT CAGCAAGGTC GATCACCTGA TCATCGGTGG TGGCATGGCC 
AACACGTTCC TTGCGGCGCG CGGCGTGAAC GTGGGCAAGT CGCTGTGCGA ACACGACCTT 
ACCGGCACCG CCGAGGAAAT TCTCGACAAT GCCGACAAGT CGGGCTGCAC CGTTCACCTG 
CCGTACGACG TGGTCGTTTC GAAGGAGTTC ACCGCAAACC CGCCGAGCCT GCGGACCTGC 
AATGTTCATG AGGTCGCTGC AGACGAGATG ATCCTCGACG TGGGCCCGGC CGCGGTCGAG 
GCGCTTGCTG ATGTGCTCAA GACCTGCAAG ACGCTGGTGT GGAACGGTCC GATGGGGGCG 
TTCGAGACCG AGCCGTTCGA CGCCGCCACC GTGGCGTTGG CGCGCACGGC TGCAGCTCTG 
ACCAAGGAAG GTTCACTCGT GTCGGTGGCG GGCGGGGGCG ATACCGTGGC TGCCCTGAAC 
CATGCGGGCG TGGTTGGTGA TTTCTCTTAC ATCTCGACTG CAGGCGGCGC CTTCCTTGAG 
TGGATGGAAG GAAAGGAATT GCCCGGCGTC GCGGCGCTGG AAGGATAG

Protein sequence

MSFKTLDDIG DLTGKTVLVR EDLNVPMQDG AVTDDTRLRA TIATLNELSD KGAKVLVLAH 
FGRPKGQPSE EFSLKKLAAP LAHVLGRPVS YIDWESDKAA VAALTPGAIA VLENTRFFDG 
EEKNDPAVIE RFASLGDIYV NDAFSAAHRA HASTEGLAHV LPAYAGRAME AELKALQKAL 
GEPERPVAAV VGGAKVSTKL DVLKHLVSKV DHLIIGGGMA NTFLAARGVN VGKSLCEHDL 
TGTAEEILDN ADKSGCTVHL PYDVVVSKEF TANPPSLRTC NVHEVAADEM ILDVGPAAVE 
ALADVLKTCK TLVWNGPMGA FETEPFDAAT VALARTAAAL TKEGSLVSVA GGGDTVAALN 
HAGVVGDFSY ISTAGGAFLE WMEGKELPGV AALEG