Gene RoseRS_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2031
Symbol
ID	5208993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	2520772
End bp	2522181
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	63%
IMG OID	640595637
Product	aspartate kinase
Protein accession	YP_001276366
Protein GI	148656161
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.296392
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGTGA TGAAATTCGG TGCAGTTGCG GTCAGTGACG CCAGCCGGGT TAATGATCTG 
GTGCGTATCG TCCGCCACGC TATCGACGAA GGCGAAGCGG TCGTGGTTGT ATGTACCGCG 
ATTGCGGACC TGACCAACCT GTTGATCGGC GCAGGACGCG CCGCAGCGCG CGGTAACCTT 
ACTGCCGCCG AGCAGGCGCG CCGCGAATTG TGGCAACGCC ACCGCACGCT CGCTGAACGC 
CTGGTAACCG ATGACTGGGA ACGCGAGACT CTCTACCGGG CATGGGCTGA CCTGCTCAAA 
TCGTTCGACC GGATTGTACG CGCGATTGCG ACGCTCGGTG AACATTCGCC ACGCAGCAGC 
GACGCCGTGG CTGCTATCGG CGAACGCTTC ATCGGGTTAT TGCTGGCAGT GGCGCTGCGG 
CGCGGCGGGG TTGCGGCGCA GTTGATCGAT GGCGCCGAGT TAATCGTGAC TGATGATCAC 
TTTGGCAATG CACGCCCGCT ACCGGAGGAA ACCACTGCAC GGGCCCGCGC ACGCCTGCTG 
CCGTTGACCC AATCGCGGAT CGTTCCAGTG GTGACCGGGT ACATCGGCGC GACTCGCCAG 
AAGATAACCA CGACGCTTGG GCGTGGCGGC GGCGATTATT CGGCAACGCT GATCGCCGCT 
GCGCTCGAAG CCGATGAAGT CGTGATCTGG ACAGATGTGC CCGGCATTCT TACTGCCGAT 
CCGAAACTGG TGCCCGAAGC ACGCACACTG CCGGAACTGT CGTATATCGA AGCCACTGAG 
ATCGCCACCC TTGGCGCGGA GGTGCTCCAC CCACGCTCCC TGACTCCGCT CGCCAATCGC 
AACATTCCGC TGCACATCCG CAGCCTGGAA CAACCCCACA TTCCGGGCAC GCGAATCGTT 
GCCGCACCGC ACATCTCTTC TGACACAGCA CGCACGATCA TCTCGGCGCC GTCCATCAGT 
CTGATCGAGA TCAGCATGAG TCCTCTGGCG GCAGCTGAAC TTGGATGGGC GCCGGACCTG 
GCGGCGCGTA TCCTGGCAGA ATTGACCGGA TGCGGCATCG AAGTGCTGAC CTTCGCGCAG 
AGTTTCAGCG AACGAGGGTT GGTGCTGGCA GTGCGTGCCA CCGATGCCGA GTATGCCTAT 
GAGCGTATCG AAGCCTGCCT GCAACCAGAG CGGGACAGCA AGGCGCTGCG TGCGATCAGT 
TTGCGTGCGC CGGTGGCGCT GGTGGCGGTC ATCAGTGCGC CGGAGAGTAC ACGTCTGGCG 
CCGCGCGCGC TGACAGCGCT GGCGCGGGTG CAGGGCACGG TGCTGGCGAT GGTTCACGGC 
AACACCTCAC GGCACCTGTC ATTCATCGTG CCAGAAGAGG AATTGAGCGC CGTCGTGCGT 
GCCCTGCACC GTGAATTGAT GGCGGGATAA

Protein sequence

MVVMKFGAVA VSDASRVNDL VRIVRHAIDE GEAVVVVCTA IADLTNLLIG AGRAAARGNL 
TAAEQARREL WQRHRTLAER LVTDDWERET LYRAWADLLK SFDRIVRAIA TLGEHSPRSS 
DAVAAIGERF IGLLLAVALR RGGVAAQLID GAELIVTDDH FGNARPLPEE TTARARARLL 
PLTQSRIVPV VTGYIGATRQ KITTTLGRGG GDYSATLIAA ALEADEVVIW TDVPGILTAD 
PKLVPEARTL PELSYIEATE IATLGAEVLH PRSLTPLANR NIPLHIRSLE QPHIPGTRIV 
AAPHISSDTA RTIISAPSIS LIEISMSPLA AAELGWAPDL AARILAELTG CGIEVLTFAQ 
SFSERGLVLA VRATDAEYAY ERIEACLQPE RDSKALRAIS LRAPVALVAV ISAPESTRLA 
PRALTALARV QGTVLAMVHG NTSRHLSFIV PEEELSAVVR ALHRELMAG