Gene RPD_0749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0749
Symbol
ID	4021222
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	840033
End bp	841154
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	54%
IMG OID	637960938
Product	UDP-N-acetylglucosamine 2-epimerase
Protein accession	YP_567888
Protein GI	91975229
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0381] UDP-N-acetylglucosamine 2-epimerase
TIGRFAM ID	[TIGR00236] UDP-N-acetylglucosamine 2-epimerase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAGA TTGCCACGAT CGTTGGAACA CGGCCGGAAA TCATCCGACT GTCTCGCATT 
ATCGCAAAAT TCGACGCCCA TTTCGAACAT GTCCTGATCC ATACTGGTCA AAATTACGAC 
TACGAGTTGA ACCAGGTCTT TTTCGATCAG TTGGGCGTCC GAGCGCCGGA CTTCTTCATG 
CATGCGGCTG GTGCTACAGC CGCGGAAACA ATCGGCAATG TCATCATCGC TTCAGACAGA 
ATCCTGGAGG AGACAAAGCC TGACGCCGTG CTGATTTTGG GAGACACCAA CAGCTCCCTG 
GCAGCCATTG CCGCGAAAAG GCGCAAGATT CCGATATTTC ACATGGAAGC GGGGAACCGT 
TGCTTTGATG CGCGGGTGCC GGAGGAAATC AACCGCAAAA TTGTGGATCA CACGGCTGAT 
ATCAATCTAA CCTACAGCTC TATTGCCCGC GAGTATCTGC TACGTGAGGG CTTCCCGCCA 
GACCAGGTGA TCCGCACGGG TTCCCCCATG CGGGAGGTTC TAGACTACTA TGCGTCAGGC 
ATTGCCGCTT CGACAGTCCT GAGCGACTTA TCGCTCCAGC CTCACCAGTT TTTCGTTGTG 
AGCTCACATC GGGAAGAGAA CGTCGATTCA CCGCAAAGAC TAAACAACCT GCTGCTCATC 
CTGAACGAGC TGGCCGATCG ATATGGTCTG CCTATTATTG TTTCGACTCA CCCCCGGACT 
AAAAATCGCC TGGCCGAAAA CAAGATCCAG ATGAACGGCC TGGTACAATT TCATCCGCCC 
TTCGGATTTC TTGACTACGT AAAACTGCAG GCGCAGGCCA AGGCCGTTCT TTCCGACAGC 
GGAACTATTA CCGAAGAATC GTCAATACTG AATTTCCCCG CGCTTAATTT ACGGGAAGTC 
CAGGAGCGCC CTGAGGGCTT CGAAGAGGCC TCGGTCATGA TGGTCGGCCT TGATCTCACG 
CGCATCCTGA CCGGCCTGCG CATTCTGGAG GACCAGCCGC GCAGCCCTGA GCGAACGCTG 
CGTATGGTCG CCGACTACAC GCCTGACAAT GTGTCGGACA AGATGGTACG CATAATTCTA 
AGCTACACCG ATTTCGTCAA CAGCCGCACG TGGCGTCAAT AG

Protein sequence

MLKIATIVGT RPEIIRLSRI IAKFDAHFEH VLIHTGQNYD YELNQVFFDQ LGVRAPDFFM 
HAAGATAAET IGNVIIASDR ILEETKPDAV LILGDTNSSL AAIAAKRRKI PIFHMEAGNR 
CFDARVPEEI NRKIVDHTAD INLTYSSIAR EYLLREGFPP DQVIRTGSPM REVLDYYASG 
IAASTVLSDL SLQPHQFFVV SSHREENVDS PQRLNNLLLI LNELADRYGL PIIVSTHPRT 
KNRLAENKIQ MNGLVQFHPP FGFLDYVKLQ AQAKAVLSDS GTITEESSIL NFPALNLREV 
QERPEGFEEA SVMMVGLDLT RILTGLRILE DQPRSPERTL RMVADYTPDN VSDKMVRIIL 
SYTDFVNSRT WRQ