Gene Rcas_2979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2979
Symbol
ID	5540471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	3863087
End bp	3864766
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	64%
IMG OID	640895097
Product	dihydroxy-acid dehydratase
Protein accession	YP_001433054
Protein GI	156742925
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.633648
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.000413857
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCAGCG ACCTCAAACG CCACAGTCGC ACGATTACCG ATGGGCGCAC CCGCGCGGGG 
GCGCGCGCGA TGCTCAAGGC AATCGGCTTT ACCGACGAGG ACCTGGCAAA GCCGATCATT 
GGCATTGCCA ACACCTGGAT CGAGACGATG CCGTGCAACA TCAACCTGCG CGCGCTGGCG 
GCGCGGGTCA AGGAGGGTGT GCGCGCAGCA GGCGGCACGC CGATGGAGTT CAACACCGTC 
GCCATTTCCG ATGGCGTCAC GATGGGCACG GAAGGAATGA AGGCATCATT GATCAGCCGC 
GACCTGATCG CCGATTCCAT CGAACTGATG GGGCGCGGCT ATATGTTCGA CGCGATTATT 
GCGCTGGTGG CGTGCGATAA AACGATCCCC GGCGCGGCGA TGGGGTTGAC GCGCCTGAAC 
GTCCCCGGCT TCCTGCTCTA CGGCGGATCG ATTGCTCCTG GTCACTGGCG CGGCAAAGAG 
ATCACGATTC AGCACGTGTA CGAGGCGATT GGTGCGGTTG CTGCCGGTAA AATGACCGAT 
GAGGAATTGA AAGAGATCGA GGATGCGGCA TGTCCCGGTC CTGGCGCGTG CGGCGGTCAG 
TACACCGCCA ACACAATGGC GACGGTCATG GAGATTATCG GGTTGTCGCC CATTGGCACG 
GCAGCAGTGC CGGCCGCCGA CCCACGCAAG GACTCGGTCG GTTATCGTGC CGGTCAGTTG 
ATCATGGATG TGTTGCGGCG CGACCTGAAG CCGCGCGATA TTCTGACGCG CGCTGCGTTC 
GAGAATGCGA TTGCCAGCGT GGCATTGACC GGCGGTTCGA CCAATGCGGT GCTCCACCTG 
CTGGCGTTGG CGCGGGAGGC CGGCGTGCCT CTGACGCTCG ACGACTTCGA CACAATCAGC 
CGCCGCACCC CGCTCTGCTG CGACCTCATG CCGAGCGGGA AGTACTCTGC CATTCACGTC 
GATCAGGCAG GCGGCATCCA GGTGATCGCC AAACGGCTCG TCGATGGCGG CTTTGCCCAC 
GGCGACGCAA TCACCGTCAC CGGGCGCACA CTGGCGGAAG AGGCAGCGGA CGCCGTCGAA 
ACACCCGGTC AGGATGTGAT CCGTCCGCTC GACAATCCGA TCAAACCGAC CGGCGGGTTG 
CTGGTGCTGC GCGGCAACCT GGCGCCCGAA GGGTCGGTCG TCAAACTGTT CGGCTACGAA 
CGCACCTACC ACCGCGGTCC GGCGAGGGTC TTCGATAGCG AAGAGGCGGC AATGGCTGCG 
ATTGTCGGCG GCGAAATCCG GCCGGATGAC ATTGTTGTTA TCCGCTACGA AGGACCGCGC 
GGCGGTCCTG GCATGCGTGA GATGCTTGGC GTTACCTCGG CAATCGTCGG CGCCGGTCTT 
GGTCAGTCGG TGTCGCTCGT TACCGATGGG CGCTTCAGTG GTGCGACGCG CGGCGTGATG 
ATCGGGCATG TGGCGCCGGA AGCGGCGCGT GGCGGCCCGC TTGCGATTGT TCAGGAAGGG 
GATGAGATCG AAATCAATCT GGATGAGCGG CGCGTCGATC TGGTGCTTTC GGAAGAAGAG 
ATCGCAGATC GATTGCTCGC CTGGCAGCCA CCAGCGCCGC GCTTCGAGTG GGGCGTAATG 
GCGCGCTACA GCGCGCTGGT GTCGTCGGCA TCCGAGGGTG CAGTGCTGGT GACGCCGTAA

Protein sequence

MSSDLKRHSR TITDGRTRAG ARAMLKAIGF TDEDLAKPII GIANTWIETM PCNINLRALA 
ARVKEGVRAA GGTPMEFNTV AISDGVTMGT EGMKASLISR DLIADSIELM GRGYMFDAII 
ALVACDKTIP GAAMGLTRLN VPGFLLYGGS IAPGHWRGKE ITIQHVYEAI GAVAAGKMTD 
EELKEIEDAA CPGPGACGGQ YTANTMATVM EIIGLSPIGT AAVPAADPRK DSVGYRAGQL 
IMDVLRRDLK PRDILTRAAF ENAIASVALT GGSTNAVLHL LALAREAGVP LTLDDFDTIS 
RRTPLCCDLM PSGKYSAIHV DQAGGIQVIA KRLVDGGFAH GDAITVTGRT LAEEAADAVE 
TPGQDVIRPL DNPIKPTGGL LVLRGNLAPE GSVVKLFGYE RTYHRGPARV FDSEEAAMAA 
IVGGEIRPDD IVVIRYEGPR GGPGMREMLG VTSAIVGAGL GQSVSLVTDG RFSGATRGVM 
IGHVAPEAAR GGPLAIVQEG DEIEINLDER RVDLVLSEEE IADRLLAWQP PAPRFEWGVM 
ARYSALVSSA SEGAVLVTP