Gene RPD_1937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1937
Symbol
ID	4022419
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	2175443
End bp	2176849
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	66%
IMG OID	637962130
Product	hypothetical protein
Protein accession	YP_569073
Protein GI	91976414
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.293644
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.311555
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCA CTTCGCAGCT ACAAGCGGTG CTCGATCGCG CCGACGCCGA TTTTGATCAC 
GCGCTGGAGC GGCTGTTCGC GCTGCTGCGG ATCAAGTCGA TCTCCGCCGA TCCGGCGTTC 
GCCGCCGACT GCAAGGCGGC CGCTACGCAT CTGGCTGCCG ACCTCGCCTC GATCGGCTTC 
GACGCCGAAG TGAAGCCGAC CGCGGGCCAT CCGGCGATCG TCGCCAAGGC CAAGGGCAAT 
ACCGGGAAGC GGCCACATGC GTTGTTCTAC GGCCACTACG ACGTGCAGCC GGTCGATCCG 
CTTGCGCTGT GGCATCGTCC GCCGTTCGAG CCGGTGGTGA CTGATCACGC CGACGGTCGC 
AAGATCATCG TCGCGCGCGG CGCGCAGGAC GACAAAGGCC AGCTTTCCAC CTTCGTCGAG 
GCCTGCCGGG CGTGGAAGAG CGTCACCGGC GAACTGCCGA TCGACCTCAC CATCGTCATC 
GAAGGCGAGG AGGAGGTCGG CTCGAAGAAC TTCGTGCCGT TCCTCGAGAC CAACAAGCAG 
GACCTCGCCG CCGACTTCGC GCTGGTGTGC GACACCGGCA TGTGGGACCC GTCGACGCCG 
GCGATCACCA CCTCGCTGCG CGGGCTCGTC TACGAGGAAG TGAAGATCAA AGCCGCCAAC 
CGCGATCTGC ACTCCGGCGT CTATGGTGGC GGCGCGCAAA ATCCGATCCG CGTGCTGACG 
CGGATTCTCG GCGGGTTGCA TGATGAGCAC GGCCGCATCA CCATTCCCGG CTTCTACGAC 
GGCGTAAAGG ATCTGCCGCC GGACATTCTG GCGCAGTGGA AGGGCCTCAA CCTCACCGCC 
GACAGTTTCC TGAAGCCGAT CGGCCTGTCG CTTCCGGCGG GCGAGGACGA TCGGCTGTTG 
ATCGAACAGA TTTCATCGCG ACCGACCTGC GATATCAACG GCATCGTCGG CGGCTACACC 
GGCGAGGGCT CGAAGACGGT GATCGCGGCG GAGGCCTCCG CAAAGGTGTC GTTCCGGATC 
GTCGAGGGCC AGGACCCGAA GAAGATCCGC GACGCCTTCC GCGCGTTCGT CACGGCGCGG 
CTGCCGGGCG ACTGCCGCGC CGAGTTCATC GATCACTCCA ACGCCCCCGC GATCGCGCTC 
GACTGGAACA TGAAGCCGCT GGCGGCGGCA AAGCGCGCGC TGACAGAGGA GTGGGGCAAG 
GACGCGCTGC TGATCGGCTC CGGCGCTTCG ATTCCGATCG TCGCCGATTT CAAGCGCACG 
CTCGGCATCG ACAGCGTGTT GATCGGCTTC GGCCTCGACG ACGACAACAT CCATTCGCCG 
AACGAGAAGT ACGACCTGCG CAGCTTCCAG AAGGGCATCC GTTCCTGGGT GCGGATTCTG 
GCGGCGCTGG CCGAGAGGGC GAAGTAG

Protein sequence

MPATSQLQAV LDRADADFDH ALERLFALLR IKSISADPAF AADCKAAATH LAADLASIGF 
DAEVKPTAGH PAIVAKAKGN TGKRPHALFY GHYDVQPVDP LALWHRPPFE PVVTDHADGR 
KIIVARGAQD DKGQLSTFVE ACRAWKSVTG ELPIDLTIVI EGEEEVGSKN FVPFLETNKQ 
DLAADFALVC DTGMWDPSTP AITTSLRGLV YEEVKIKAAN RDLHSGVYGG GAQNPIRVLT 
RILGGLHDEH GRITIPGFYD GVKDLPPDIL AQWKGLNLTA DSFLKPIGLS LPAGEDDRLL 
IEQISSRPTC DINGIVGGYT GEGSKTVIAA EASAKVSFRI VEGQDPKKIR DAFRAFVTAR 
LPGDCRAEFI DHSNAPAIAL DWNMKPLAAA KRALTEEWGK DALLIGSGAS IPIVADFKRT 
LGIDSVLIGF GLDDDNIHSP NEKYDLRSFQ KGIRSWVRIL AALAERAK