Gene Rpal_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1945
Symbol
ID	6409605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	2098215
End bp	2099465
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	66%
IMG OID	642711831
Product	allantoate amidohydrolase
Protein accession	YP_001990943
Protein GI	192290338
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCAAGA CTGCCTCGAA CCTGCAGATC GATTCCTCGC GGCTGTGGGA CACTATCGTC 
AGCACCGCGC AGTTCGGCGG CACTCCGAAA GGCGGCGTGA AGCGCCTGAC GCTGTCGGCG 
GAAGACAAGC AGGTGCGCGA CTGGTTTCGC CAGGCGTGCG AGCAGGCAGG CCTCGAGGTC 
AGCATCGATT CACTCGGCAA CATGTTCGCG CTACGCAAGG GCCGCGACAT GACCAAGCCA 
CCGATCGGCC TCGGCTCGCA TCTCGATACC CAGCCGACCG GCGGCAAGTT TGACGGCATC 
CTCGGCACCC TCGCCGCTCT CGAAGTGATC CGGACCCTCA ACGACGCCGG CATCGAGACC 
GAGCTGCCGC TGTGCATCAC CAACTGGACC AATGAGGAAG GCTCGCGATT CGCCCCGGCG 
ATGATGGGCT CGGCGGCGTT CGTCGGCGAC TTCACCGTCG AGGACGTGCT GTCGCGCAGG 
GATGCGGCCG GCATCAGCGT CGCCGAAGCG CTCGACAGCA TCGGCTATCG CGGCGACAAA 
CTGGTTGGCG CCCAACCGTT CACCGGCTTC ATCGAGCTGC ATATCGAGCA GGGCCCGATC 
CTGGAGGCGG AAAGCAAGAC CATCGGCGTG GTCGATCACG GCCAGGGCGT GCTGTGGTAC 
GACGGCAAGA TCACCGGCTT CGAAAGCCAT GCCGGATCGA CCCCGATGCA TCTGCGCCGC 
GACGCGCTGG CGACGCTGTC GGAGATCGTG CTGGCGGTCG AGAAGATCGC AACCGAACTC 
GGCCCCAATG CCGTCGGCAC TGTCGGCGAA GCGGTGATCG CCTCCCCGTC ACGCAACGTC 
ATTCCCGGCG AGATCGCCTT CACCATCGAC ATGCGCAGCG CCGATGCGGC GATCATGGAT 
CAGCTCGACC AGCGGCTGCG CGCCGCGATC GCCGAGATCG CGCCGCGGCG CAAGGTCGAG 
GTCGCGCTCG ATCTGGTGTG GCGCAAGGAG CCGACGCACT TCGATCCTGC CCTGGTCGGC 
AGCGTCGAGA ACGCCGCCAA CGCCCTCGGC TATCAGAACC GCCGCATCAC CTCCGGCGCC 
GGCCACGATG CCTGCAACCT CAACACCAGA ATCCCGACCG CGATGATCTT CGTGCCCTGC 
AAGGACGGCA TCAGCCATAA CGAGTTGGAG GACGCGACCC AGCCCGACTG CGCCGCCGGT 
GCCAACGTGC TGCTGCACAC CGTGCTGTCA CTCGCCGGCG TCGCCAAGTA A

Protein sequence

MTKTASNLQI DSSRLWDTIV STAQFGGTPK GGVKRLTLSA EDKQVRDWFR QACEQAGLEV 
SIDSLGNMFA LRKGRDMTKP PIGLGSHLDT QPTGGKFDGI LGTLAALEVI RTLNDAGIET 
ELPLCITNWT NEEGSRFAPA MMGSAAFVGD FTVEDVLSRR DAAGISVAEA LDSIGYRGDK 
LVGAQPFTGF IELHIEQGPI LEAESKTIGV VDHGQGVLWY DGKITGFESH AGSTPMHLRR 
DALATLSEIV LAVEKIATEL GPNAVGTVGE AVIASPSRNV IPGEIAFTID MRSADAAIMD 
QLDQRLRAAI AEIAPRRKVE VALDLVWRKE PTHFDPALVG SVENAANALG YQNRRITSGA 
GHDACNLNTR IPTAMIFVPC KDGISHNELE DATQPDCAAG ANVLLHTVLS LAGVAK