Gene TM1040_1934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1934
Symbol
ID	4076885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2036243
End bp	2037481
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	60%
IMG OID	638007250
Product	aspartate kinase
Protein accession	YP_613929
Protein GI	99081775
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.167611
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCTAC TTGTGATGAA ATTCGGCGGC ACATCCGTCG CCAATCTGGA CCGCATTCGC 
CGCGCTGCCA AACGCGTTGG TGTCGAAGTG GCCAAAGGCT ATGACGTGAT CGTCATTGTC 
TCCGCCATGT CCGGCAAGAC CAACGAGCTG GTCGGTTGGG TGGGGGAGAC CTCGCCGCTC 
TATGATGCGC GTGAATATGA TGCGGTTGTA TCCTCTGGTG AGAATGTGAC CGCGGGCCTC 
ATGGCGTTGA CGCTGCAAGA GATGGACGTG CCCGCGCGCA GCTGGCAGGG CTGGCAAGTG 
CCGCTCAAGA CCAACTCGGC CCACAGCCAG GCCCGGATCG AAGAGATCGG CACAGAGAAC 
ATCAACCAGA AGTTCGGCGA AGGCATGAAA GTGGCCGTTG TTGCGGGCTT TCAGGGGATT 
TCTCCCGAAG GTCGCATCAC CACCCTCGGG CGCGGCGGCT CTGACACCAC AGCGGTGGCT 
TTTGCGGCGG CCTTCGGGGC GGAGCGCTGC GATATCTACA CCGATGTGGA CGGCGTCTAT 
ACCACCGACC CGCGCATCTG CGAAAAGGCA CGCAAGCTCG ACAAGATCGC CTTTGAGGAA 
ATGCTGGAGC TGGCATCCTT GGGCGCCAAG GTGCTGCAAA CCCGCTCCGT CGAGCTGGCG 
ATGCGCTACA AGGTGAAACT GCGCGTGCTC TCGAGCTTTG AAGAACAGTC CGACGAGGCC 
GGAACCCTGG TCTGCGACGA GGAGGAAATC ATGGAATCCA ATGTTGTTAA CGGCGTTGCC 
TACTCGCGGG ATGAGGCCAA ACTGACCTGT CTTTCGGTCG CGGACCGTCC GGGCATCGCG 
GCGACCATTT TTGGCTGCCT CTCGGATGCC GGCGTCAACG TCGATATGAT CGTGCAGAAC 
ATCTCTGAAG ATGGGCGCAC GGATATGACG TTCTCTTGCC CCACGGATCA GGTACAGCGC 
GCGGAAATGG CCCTGAACGC CTACAAAGAG AAGGGCGAGC TGAACTTTGC TGAACTCGTG 
GCGGACACCG GTGTTGCGAA GATTTCGGTG GTGGGCATCG GCATGCGATC GCAGTCCGGT 
GTGGCCGCCA AGATGTTCAA GGTCCTCTCG GATGAGGGCA TCAACATCAA GGTGATCACC 
ACCTCCGAGA TCAAGATTTC GGTGCTGGTG GACCGCAAAT ACATGGAGCT CGCCGTGCAG 
GCCCTGCACG ACGCCTTTGA GCTCGACAAA GCCAGCTGA

Protein sequence

MPLLVMKFGG TSVANLDRIR RAAKRVGVEV AKGYDVIVIV SAMSGKTNEL VGWVGETSPL 
YDAREYDAVV SSGENVTAGL MALTLQEMDV PARSWQGWQV PLKTNSAHSQ ARIEEIGTEN 
INQKFGEGMK VAVVAGFQGI SPEGRITTLG RGGSDTTAVA FAAAFGAERC DIYTDVDGVY 
TTDPRICEKA RKLDKIAFEE MLELASLGAK VLQTRSVELA MRYKVKLRVL SSFEEQSDEA 
GTLVCDEEEI MESNVVNGVA YSRDEAKLTC LSVADRPGIA ATIFGCLSDA GVNVDMIVQN 
ISEDGRTDMT FSCPTDQVQR AEMALNAYKE KGELNFAELV ADTGVAKISV VGIGMRSQSG 
VAAKMFKVLS DEGINIKVIT TSEIKISVLV DRKYMELAVQ ALHDAFELDK AS