Gene RPD_0372 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_0372
Symbol
ID	4020838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	-
Start bp	436731
End bp	438272
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	70%
IMG OID	637960557
Product	hypothetical protein
Protein accession	YP_567511
Protein GI	91974852
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.231054
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCGA TCGCCACTTC CCGCACCCGC CTGTCGCTGA TCGAGCGCTG GATCGACGCC 
TTGCTCGATC CCAAGCGGCA GGAGCGTACC GTCGTCCTGT CGCTGGCGGC CTATGCGGCG 
ATCTGGACCG CCTACCGGAC CATCGCCACC TGGCCGCGCG ACCTGCACGC CGACGTCACC 
GAGCTGTACG GCTGGTCGCG GAATCTGGCG TTCGGCTACG ACAAGCACCC GCCGTTCTCG 
GCCTTCGTCA CCCGCGCCTG GTTCAGCGTG GTCCCGGTCT CGGACCTGAC GTTCCATTTG 
CTGGCCACGG CGAATATCGC GCTGACGCTG TACATCGCCT GGCGGACGAT GCGGCGTTAT 
ATGGCGGCCG AGAAGGCGCT GTTCGGGCTG GCGTTGCTGA CGCTGATCCC GTTCTTCAAT 
TTCATCGCGC TGAAATACAA CGCCAATGCG GTGCTGCTGC CGCTATGGGC GCTGACCATC 
CATTGTTTCC TGCGCGCCTT CGAACAGCGC AGCCTTCTGT GGCCTGCGCT GGCCGGGGTG 
TTCGCCGGCT GTTCGATGCT GGGCAAATAC TGGTCGGTGG TGCTGATCGG CGCGCTCGGG 
CTCGGCGCGC TGCTCGACCC GCGGCGCGCC CGGTTCTTCG GCTCACCGGC GCCGTGGCTG 
ATGATCGTGG CCGGCGCGCT GGTGCTGGCG CCGCATCTGG CCTGGCTGGT CGATCACCGG 
TTTCCGTCCT TCACCTACGC TGCGGCGCGC GCGGGGAGCG GCTTCTTCGA GAACGCCCTC 
GACACGCTGC GCTATCTCGC CGGCTGCCTC GGCTACGCCG CGCTGGCGCT GGTCGCCACC 
TGGGCGCTGC TGCGGCCGTC GCGGGCGGCG CTGATCGACA GCGCCTGGCC GGCCGATCCG 
CAGCGCCGGC TGATCGTCAC GATCCAGTTC CTGATGATCG TGGCGCCCGC GCCGGTGGCG 
CTGGCGAGCG GCATCCGGAT CGTGCCGCTG TGGACGATGC CGGCGTGGAC GCTGCTGCCG 
ATCGTGCTGC TGTCGTCGCC GCTGATCGAG GTCGGGCGGG CGGCGCTGCG GCGGATGCTG 
ATCGGCGCGG CGGCGCTGGC GCTGGCGATC CTCGCCGCTG CGCCCGGCGT GGCGGTGGCG 
ATCCACACCA CCAGCGCGCC CGAGCCGTTC GAATATGCGT CATTGCTGGC CGACGACATC 
GCGCGGACCT GGCAGCGGCA CAGCGACAAG CCGATCGCGT TGGTCGCAGG CGAAACGGTG 
CTGGCGGAGA ACACCGCCTA TTATCTGCGC ACCGACACGC GCGCGTTCGA GACGGCCGAT 
CTGGCGGCGC TGAAGGCCGA AGCCACCGCA CGCGGCGCGG TGCTGGTGTG CTCGGCGACG 
GATCAGACCT GCCTGGCGAC CGCCGAGCAG ATCGTCGCGG GTCAGCCGCA GATCCTGCGC 
AGCAAGGTGT GGCTCAGCCG GCCGCTGTTC GGGATCGCGG GCGGCACGGT GCGGGACGTG 
TTTCTGCTGG TGCCGCCGCC GGCGACGGGC GCCGCGAAGT AG

Protein sequence

MTSIATSRTR LSLIERWIDA LLDPKRQERT VVLSLAAYAA IWTAYRTIAT WPRDLHADVT 
ELYGWSRNLA FGYDKHPPFS AFVTRAWFSV VPVSDLTFHL LATANIALTL YIAWRTMRRY 
MAAEKALFGL ALLTLIPFFN FIALKYNANA VLLPLWALTI HCFLRAFEQR SLLWPALAGV 
FAGCSMLGKY WSVVLIGALG LGALLDPRRA RFFGSPAPWL MIVAGALVLA PHLAWLVDHR 
FPSFTYAAAR AGSGFFENAL DTLRYLAGCL GYAALALVAT WALLRPSRAA LIDSAWPADP 
QRRLIVTIQF LMIVAPAPVA LASGIRIVPL WTMPAWTLLP IVLLSSPLIE VGRAALRRML 
IGAAALALAI LAAAPGVAVA IHTTSAPEPF EYASLLADDI ARTWQRHSDK PIALVAGETV 
LAENTAYYLR TDTRAFETAD LAALKAEATA RGAVLVCSAT DQTCLATAEQ IVAGQPQILR 
SKVWLSRPLF GIAGGTVRDV FLLVPPPATG AAK