Gene Sama_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1049
Symbol
ID	4603301
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	+
Start bp	1269889
End bp	1271100
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	55%
IMG OID	639780388
Product	aspartate kinase
Protein accession	YP_926926
Protein GI	119774186
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00683315
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.60962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAAAAA TTTATGTAAA GAAGTTCGGA GGCACCTCTG TGGGTACCTT CGAACGCATT 
GAGGCGGTGG CAGATGCCAT CGCCAAAGCG CATTTTGAAG GTGAGAGGCA GGTGTTGGTG 
CTCTCGGCTA TGGCCGGCGA AACCAACAGG CTTTATGCCA TGGCCGCCAA CATAGACCCT 
CTGGCACCTG CCCGGGAATT GGACATGTTG GTGAGTGCAG GTGAGCAGGT CAGTATTGCC 
CTGATGTCTA TCGCGCTGGC AAGACGGGGC GTTAATGCCA GGTCTTTGCT GGGTAGCCAG 
GTCAAGGTGC GCACTAACAG CCAGTTTGGC AGAGCCAGTA TTGAGTCCGT TGACACAGGG 
TTATTGATGC AGTTGCTGGA CGAAGGCGCT GTACCTGTTA TCGCCGGGTT TCAAGGCGTC 
AACGAGCAGG GCGATGTGAC AACTCTTGGG AGGGGTGGCT CAGATACCAC TGCCGTTGCC 
ATTGCCGCCG CACTTGAGGC GGCTGAGTGT CAAATCTTTA CTGATGTGAC CGGCGTTTTT 
ACCACAGATC CCAATATAGA TCCCGATGCC CAGAAACTCG ATAGCATCAG TTTCGAAGCC 
ATGTATGAAA TGGCAAGGCA GGGCGCTAAG GTATTGCATC CCGACAGCGT TGCCTGTGCA 
CGCCGTCATG GCGTGGTGCT TAGGGTGTTG TCGAGTTTTG AGTCCGGCAG TGGCACCCTT 
ATCCGCTTCG ATGAGCCAGA GCACTCCGGC TCGGGCATTG TGGGCATTGC CGTTACCCGT 
GGACAAGGCC TGGTCTCTGT TGCCGGTTTG GTGGATCAGC CGCAGGCGGA AGTAGCCCTG 
TTTCAGGCGC TGGCAAACGC CTCTGTGGAT ACTGACCTGG TGGTACAGCT GGCGGAAGAA 
AAGGCACTGG CATTTACCCT GGCGCAAGGT GCACTCGATA AGGTGTTGAC CCTGATAGAC 
AGGTTGGCGC TTGAGCAGCC TCTGGCGGAC GTTCGCCATG AGTCGCCATT GGCCAAGGTG 
TCCCTCGTCA GCACCGGTAA AGCAGTCATG GCTGAAGTGG GGGCTCGTGT TACCGAGCTT 
TTGGAAGCAC AAAACATTCG TGTTAAGTTA CTTTCGACAT CAGAAATCAA ACTGTCGGTG 
GTAATCGATG AGGTGCATCT GCAGCATGCC GTCAGAAGTT TGCACAGAGC GTTTGACCTC 
AATAAAGTAT GA

Protein sequence

MTKIYVKKFG GTSVGTFERI EAVADAIAKA HFEGERQVLV LSAMAGETNR LYAMAANIDP 
LAPARELDML VSAGEQVSIA LMSIALARRG VNARSLLGSQ VKVRTNSQFG RASIESVDTG 
LLMQLLDEGA VPVIAGFQGV NEQGDVTTLG RGGSDTTAVA IAAALEAAEC QIFTDVTGVF 
TTDPNIDPDA QKLDSISFEA MYEMARQGAK VLHPDSVACA RRHGVVLRVL SSFESGSGTL 
IRFDEPEHSG SGIVGIAVTR GQGLVSVAGL VDQPQAEVAL FQALANASVD TDLVVQLAEE 
KALAFTLAQG ALDKVLTLID RLALEQPLAD VRHESPLAKV SLVSTGKAVM AEVGARVTEL 
LEAQNIRVKL LSTSEIKLSV VIDEVHLQHA VRSLHRAFDL NKV