Gene RoseRS_4165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_4165
Symbol
ID	5211149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	5215329
End bp	5216900
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	60%
IMG OID	640597754
Product	malate synthase
Protein accession	YP_001278459
Protein GI	148658254
COG category	[C] Energy production and conversion
COG ID	[COG2225] Malate synthase
TIGRFAM ID	[TIGR01344] malate synthase A

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.975172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACACAC CGTATCGTGT CGAACTTCTT GGTCCGACCA GGCCGGAATG GTCAGAGATC 
CTCACGGCTG AAGCGCTCGA TTTTGTTGCC TCACTGGCGC GTCAGTTCGA GCATCGCCGG 
CGCGCGCTGC TGGCTGCACG TGATCAGCGA TGGGCGGACA TCAAATCCGG CGCACTGCCC 
GATTTCCTGC CTGAGACGGT TGACATTCGC GGCGGCGATT GGAGGGTGGC TTCCATTCCC 
GCTGACTTTT CCAATCGGCG GGTTGAGATT ACCGGTCCTA CTGATCGGCG TATGGTGATC 
AATGCGCTCA ACTCTGGCGC ACAGGTCTTT ATGGCGGATT TTGAGGATGC CAACGCCCCA 
ACCTGGGAAA ACATCGTTCA GGGGCAACTC AACCTGCGTG ATGCCGTTCG CCGGACGATC 
ACCTTCGTCA GCCCGGAGGG GCGTGAGTAT CGCCTGAATG ACACAACCGC CACCCTGGCG 
GTGCGACCGC GCGGCTGGCA CCTTGTCGAG AAGCATGTCC ACGTTGATGA TGAGCCAGTG 
GCTGGCGCTT TCTTCGATTT CGGGTTGTAC TTTTTCCACA ATGCGCACGA GTTGATCCGA 
CGCGGTAGCG GTCCGTATTT CTACCTGCCG AAGATGCAGA GCCACCTGGA AGCGCGGCTC 
TGGAACGACG TGTTCAACTT TGCGCAGGAT CGGCTCGGCA TCCCGCACGG TACGATCCGC 
GCCACCGTAC TGATCGAGCA CATTCTGGCG GCGTTCGAGA TGGAAGAGAT TCTGTACGAG 
TTGCGCGAAC ACAGCAGCGG TTTGAACCTG GGTCGCTGGG ATTATATCTA CAGTTTCATC 
AAGACGTTCA GCCACCGCGA CGACTGGATC TTCCCCGATC GCGCACAGGT GACGATGACG 
ACCCACTTCC TGCGTTCAGC GGCGGAACTC GTGGTCTATG CGTGCCACAA GCACGGCGCC 
CACGCGCTCG GCGGCATGTC GGCGTTCATT CCGAACCGCC GCGAACCGGA GATTACCGAA 
CGCGCCCTGG CGCAGGTGCG CGCCGATAAA GAGCGCGAGG CGAAGCAAGG GTTCGATGGC 
GCCTGGGTGG CGCATCCCGA CCTGGTGCCG ACGGTGCTCG AAGTCTTCAA CACGGCGTTT 
CCGGGTGATC ATCAGATCCA CTATGTGCCC GAGGTGCACG TCACCGCTGC CGATCTGCTG 
ACCATCCCGC AGGGAACCAT CACCGAAGCC GGGTTGCGCA ACAATATCAA TGTGGCGCTG 
CAATACCTCG AGGCGTGGCT TGGCGGTCGC GGCGCGGTTG CGATTTTCAA TCTGATGGAA 
GATGTGGCGA CTGCTGAGAT TGCGCGTTCG CAGATCTGGC AGTGGGTGCG CTACAACGCG 
AAACTGAACG ATGGTCGCAC GGTCGATGAG ACCATGTACA AGACGATCCG TGATGAAGAA 
TTGCACGCAC TCGTCACTGC CCGCACCGGC GATCATCACT TCGCGCAGGC TGCCGAACTC 
CTCGATGAAC TGACACTGTC GCATGATTTT GTCGAGTTCC TGACCATCCC CGGCTACCGT 
CGTCTGGATT GA

Protein sequence

MDTPYRVELL GPTRPEWSEI LTAEALDFVA SLARQFEHRR RALLAARDQR WADIKSGALP 
DFLPETVDIR GGDWRVASIP ADFSNRRVEI TGPTDRRMVI NALNSGAQVF MADFEDANAP 
TWENIVQGQL NLRDAVRRTI TFVSPEGREY RLNDTTATLA VRPRGWHLVE KHVHVDDEPV 
AGAFFDFGLY FFHNAHELIR RGSGPYFYLP KMQSHLEARL WNDVFNFAQD RLGIPHGTIR 
ATVLIEHILA AFEMEEILYE LREHSSGLNL GRWDYIYSFI KTFSHRDDWI FPDRAQVTMT 
THFLRSAAEL VVYACHKHGA HALGGMSAFI PNRREPEITE RALAQVRADK EREAKQGFDG 
AWVAHPDLVP TVLEVFNTAF PGDHQIHYVP EVHVTAADLL TIPQGTITEA GLRNNINVAL 
QYLEAWLGGR GAVAIFNLME DVATAEIARS QIWQWVRYNA KLNDGRTVDE TMYKTIRDEE 
LHALVTARTG DHHFAQAAEL LDELTLSHDF VEFLTIPGYR RLD