Gene Rcas_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1034
Symbol
ID	5538500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1350031
End bp	1351377
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	59%
IMG OID	640893173
Product	diaminopimelate decarboxylase
Protein accession	YP_001431156
Protein GI	156741027
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCACA CGACTCAAGA AGGCATAAAC AACGCACACC TCTGGCCCCT GACGACGGTA 
GTCGATATGC ATGGGCGACT GATGATCGGC GGCTGCAATG TGGCGACTCT GGCGCGTCAG 
TACGGCACGC CGCTCTACCT GTTCGATGAA GAGACCATTC GCAGCGCCTG CCGCACCTGG 
CGAACGGCGC TTGCAGCCTG TTACCGGGGG GAGACGGCAG TTCATTACGC GAGTAAAGCG 
TTGCTCAACA CTGCGCTCAC ACACCTGATC GCTGATGAAG GGCTGGGGCT GGACGTAGTC 
TCAGGCGGTG AGTTATACGT GGCGCTCCGC GCCGGCTTCC CGCCGCAGCG CATTCATATG 
CACGGCAACG CCAAAACGCG CGCCGAACTG GAACAGGCGC TGGCCTCCGG AATCGGACAG 
ATCATTGTCG ATAATCTCGA TGAACTGGCG ATGTTGGCGA ACCTGACCGC ATATCGTTCA 
CCACCACAAC CGATTGCGTT GCGCATTGCA CCGGATATCG TCACCAATAC GCACGCCCAT 
ATTCAAACCG GTCACGCGAC ATCGAAGTTC GGTCTACCAC TTGATGCACT CGATGCCGCC 
GCCGAACGGT TACGCACTGC GCCCGGTCTG TGCCTGATCG GGTTACACGC TCATCTCGGG 
TCGCAACTCT TCGACCTGGA ACCATATGCC GCTGAGATCG ATACGCTGCT CGACAGCGCC 
TCGCGCCTGC GTGATCGCCA CGGTTTCATT ATTCAGCAAA TCAACATCGG CGGAGGAGCA 
GGAGTGCCAT ACACTGCGGA TCAGCACCCC TTCGATGTAC ACGCTCTTGC GATGAGATTG 
GGAGAAGCGC TCACCGATGA ATGCCGCCGA CGCGGGTTTC CCCTGCTGCA CCTGGTGATC 
GAACCAGGAC GTTCAATCAT CGCGCGCGCA GGGGTAGCGC TCTATACGAT TATCGCAACA 
AAGAATCTTC CGCATATGCG ATTCCTACAT ATCGACGGCG GCATGGGCGA CAATATTCGT 
CCGGCGCTCT ACGGCGCGCG GTATAGTGCG GTGCTGGCAG AACGGGCGAA TGCGCCAATC 
GAAGAGAGCG TAGCGATTAC CGGGCGCTAC TGCGAATCGG GCGATGTGTT GATCCATGCC 
GCACCGCTCC CGCGCGCCAG CGTTGGCGAC ATTCTGGCAG TTCCTGTGGC GGGCGCCTAC 
ACGCTGAGCA TGGCCAGCAC ATACAACCTG ACTCCACGTC CGGCGGTTGT CATGGTGAAT 
GGTGGGTCAG TACGTCTCAT TCAGCGCCGC GAAACGTATG AGGATATGAT TGCCAGGGAT 
GTGGTGTCGT CGCAGGGGCA GGTCTGA

Protein sequence

MNHTTQEGIN NAHLWPLTTV VDMHGRLMIG GCNVATLARQ YGTPLYLFDE ETIRSACRTW 
RTALAACYRG ETAVHYASKA LLNTALTHLI ADEGLGLDVV SGGELYVALR AGFPPQRIHM 
HGNAKTRAEL EQALASGIGQ IIVDNLDELA MLANLTAYRS PPQPIALRIA PDIVTNTHAH 
IQTGHATSKF GLPLDALDAA AERLRTAPGL CLIGLHAHLG SQLFDLEPYA AEIDTLLDSA 
SRLRDRHGFI IQQINIGGGA GVPYTADQHP FDVHALAMRL GEALTDECRR RGFPLLHLVI 
EPGRSIIARA GVALYTIIAT KNLPHMRFLH IDGGMGDNIR PALYGARYSA VLAERANAPI 
EESVAITGRY CESGDVLIHA APLPRASVGD ILAVPVAGAY TLSMASTYNL TPRPAVVMVN 
GGSVRLIQRR ETYEDMIARD VVSSQGQV