Gene Rcas_1835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1835
Symbol
ID	5539313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2343853
End bp	2344998
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	62%
IMG OID	640893973
Product	amidohydrolase 2
Protein accession	YP_001431944
Protein GI	156741815
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACTTCC AGCCTCCGGA AGCGTTCGCG TATCTGGCTG ACGCGGCGGA ACGCGAACCG 
TATTGGGCAA TGCTCCTCGG TCTGCACGCA GAGACTCGTC AGACTGCGAC ATCGGCGGAT 
GAAGGGCGCG TTTTGGCAGA TATGGATCGC GCCGGGATCG ACCGCGCGGT GATCCAGGGA 
GAGTACTACC GCCAGCACGA ATCATGCGTT GCTGCCAATG ACCGCGCGCT GGCGCTGTAT 
CGGCGCCACC CGGAACGATT TCTGGTCTTT GCCATCGTGC AGCCCACCGA CCATCGCGCA 
CTCGACGAAG TGCGGCGTTG CGCTGCTGCT GGCGCTGCCG GTATCGGAGA ACTCAACCCG 
TATGCGCAGG GGTTCACGCT CGACTCACCC GCGTTTCTGC GACTGGCAGA GACCTGTATT 
GACCTCGGAC TGCCGATTCT GCTCCATGTG AACGAGCCGG TGGGACGCTA TTACCCTGGC 
AAAGCCGTCA CGCCGCTGGC GCAATACTAT GATCTTGCGC TGCGGTTTCC AGAACTCACG 
ATCATCCTGG CGCACTGGGG AGGGGGGTTG TTCTTCTACG AACTCATGCC GTCGGTGCGT 
CAGGCGCTCC GCAATGTCTG GTACGATACG GCGGCATCAC CGCTGCTCTA CCCGACTGCC 
GACATTTTCG CGGTGGCGCT CCGTTGCGTC CATCCGCGTA AAATCCTGTT TGGCAGCGAT 
TATCCACTGC CGCTCTTCCC ACGGGTGTCG CGCGAACCCG ATCTTTCCGC CTTTCTCAAC 
GACATCATGG CGTTAGACAT TGCGCCCGAC ATCCGCGATG ATCTTCTGGG ATACAACAGC 
GCGCGCCTGC TGGGGTTGAT GACGTCTGAG GAAGCCCCTG CGCTTGAGTC TTCGCGGCGC 
TCGAACGTTT TACCCCTTCC TCGCTATCCA ATTACGGCTG CCATGTCGGT CGCTGCCATT 
GCCGCCGCCT GGTCTTCGAC CCGCGCCGTC CTGGAAGCCT ACGGCATCCC CTGGGAAACG 
GTCGAGGCGC CGTTGTGGGA ACCCCTCCGT CAGGCAGCGG CGGCGCGCGG GATTGGACCA 
GAACGCCTGA AGCGGTTGCT CGCCGATCTC AACGCTGCTG TTCAACACGA GAGTGAAACG 
CCATGA

Protein sequence

MHFQPPEAFA YLADAAEREP YWAMLLGLHA ETRQTATSAD EGRVLADMDR AGIDRAVIQG 
EYYRQHESCV AANDRALALY RRHPERFLVF AIVQPTDHRA LDEVRRCAAA GAAGIGELNP 
YAQGFTLDSP AFLRLAETCI DLGLPILLHV NEPVGRYYPG KAVTPLAQYY DLALRFPELT 
IILAHWGGGL FFYELMPSVR QALRNVWYDT AASPLLYPTA DIFAVALRCV HPRKILFGSD 
YPLPLFPRVS REPDLSAFLN DIMALDIAPD IRDDLLGYNS ARLLGLMTSE EAPALESSRR 
SNVLPLPRYP ITAAMSVAAI AAAWSSTRAV LEAYGIPWET VEAPLWEPLR QAAAARGIGP 
ERLKRLLADL NAAVQHESET P