Gene Rcas_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1840
Symbol
ID	5539318
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2349683
End bp	2351029
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	62%
IMG OID	640893978
Product	peptidase M20
Protein accession	YP_001431949
Protein GI	156741820
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGTT TCGATGCGCA CATTGAGGAA AACAAGGGGC GCTACTTCGA CGAACTTTGT 
GCGCTGTTGC GTCAGCCGTC GATTGCGGCG CAGGGAATCG GCATTGAAGA GACGGCGACG 
CTGGTCACAC AGCGTCTCGA GCGACTCGGT GCGCAGGTGC AGGTTTTTCA CATGCCTGGC 
GCTGCGCCAG TAGTGTACGG CAGCATTGGT CACGGCAATC GCACACTGCT GATCTACGAC 
CACTACGACG TTCAACCGCC AGAACCGCTC GATCTCTGGC ATTCGCCACC ATTCGAACCG 
ATGCTGCGCG ACGGTAAACT ATATGCGCGC GGCGTCGCCG ACAACAAAGG CAACCTGATG 
CTGCGCATCC AGGCAATCGA GTCGTGGCTG GCGGCGTATG GCGCCCTTCC CTGCCGCGTC 
AACTTTCTGA TCGAAGGGGA AGAAGAGATC GGCTCGATCA ACCTCGAAGC CTTCTGTCAG 
AGCCACCCCG ATTTGCTGCG CGCCGACGGG TGTCTGTGGG AAACCGGCGG CGTGAACGCC 
CTCGAGCAAC CGACGATCAT GTGCGGCGCA AAGGGCATCT GCTATGTCGA ACTAGTCGTG 
CGCGGCGCAT CGCACGATCT GCACTCCGCC AATGCAACGA TGGTCCCCAA CCCCGCGTGG 
CGGCTCACGT GGGCGCTGGC GACGCTCAAA GCACCCGATG AGCGGGTGCT GATCCCCGGT 
TTCTACGACT GGGTGCGCCC GCCGTCGGCA GCGGACATGG CAGCGCTGGA ACGCATTCCG 
CTCGACGACG AGGAACTGCT GGCGGATTTC GGCATCCCGC AGTTCCTTGG CGGGCTGCGC 
GGCATCGAGC GTCTAAAGGC GCACCTCTTC AACCCTACCT GCACCATCTG CGGACTGATC 
TCCGGCTACA CCGGCGAAGG TTCGAAGACG GTGCTGCCAT CCGAGGCGCG CGCCAAAATC 
GATTTCCGCC TCGTGCCCGA TATGGACCCG GCGGACGTGG TGGCGGCGTT GCGCCGTCAT 
CTTGATGCGC ACGGCTTCGA CGACATCGCT ATTATCGAGT ACGGGCACGA AAAACCGGGG 
CGCTCCGACC CCGACTCGCA CGTCGTCCAG GCAATGGCGA CGGCAATTCG CGCCACGTAC 
CACATGGACC CAATCATTTA CCCGACAATG GCAGGCACCG GTCCGGTCTA TCCAGTCTGC 
ACAGCGGCGG GAACGCCGAT GACGACGGGG TGCGGCACAG GGTATCAGGG ATCGCTGGTC 
CATGCGCCGA ATGAAAACAT CCGGCTGGAC GACTACTGGA CGGCGATGCG CTGTATGGGG 
GCGTTCCTTC AGGCGTTTGC GGCATAG

Protein sequence

MDRFDAHIEE NKGRYFDELC ALLRQPSIAA QGIGIEETAT LVTQRLERLG AQVQVFHMPG 
AAPVVYGSIG HGNRTLLIYD HYDVQPPEPL DLWHSPPFEP MLRDGKLYAR GVADNKGNLM 
LRIQAIESWL AAYGALPCRV NFLIEGEEEI GSINLEAFCQ SHPDLLRADG CLWETGGVNA 
LEQPTIMCGA KGICYVELVV RGASHDLHSA NATMVPNPAW RLTWALATLK APDERVLIPG 
FYDWVRPPSA ADMAALERIP LDDEELLADF GIPQFLGGLR GIERLKAHLF NPTCTICGLI 
SGYTGEGSKT VLPSEARAKI DFRLVPDMDP ADVVAALRRH LDAHGFDDIA IIEYGHEKPG 
RSDPDSHVVQ AMATAIRATY HMDPIIYPTM AGTGPVYPVC TAAGTPMTTG CGTGYQGSLV 
HAPNENIRLD DYWTAMRCMG AFLQAFAA