Gene RPD_1113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1113
Symbol
ID	4021589
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1266403
End bp	1267725
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	64%
IMG OID	637961305
Product	glycoside hydrolase family protein
Protein accession	YP_568252
Protein GI	91975593
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2730] Endoglucanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCAG CCGTGCCGAG CCATGTCGCC GATCCGCCCG CGATCGTCAG GGACGCGGGT 
GATTTGCGCC CAGCCGGGCG CGGCGGATAT CTGCTGCCAA ACGGCTATCT CAGCACGTCG 
GGCAGTCAGA TCGTCGATGC TTCGGGCCGG CCGGTCCGCA TCGCCTCGAT CGGCTGGAAC 
GGCACCGAGG GGCCGCTCGG AGCCGCGCCA TCGGGCATCT GGCGCGTCAG CTACAAGACC 
GTCCTCGACT CGATCGTCGC GGCCGGCTTC AACGCGGTGC GAATTCCATG GACCGATATC 
GGGCTGAATG CGCCGCTCAA CGGCTACAGC GACCGGCTCG GCTGGATCAA CATCACGCTG 
AACCCGGAGC TGCTCGCGAG CTCCACGCCG AATTCGCAGG GTCGCTACCA ATACGTCACC 
ACGCTGGTCG CGTTTCAGCG CATCGTCGAC TACGCGCAGG AGATCGGCCT CAAGGTGATC 
TTCAATCATC ACACCAATCA GGGCACCGCC GGGCAGCAGC GCAACGGGCT GTGGTTCGAC 
CTCGGTCCCG GCACCGACAA CACGGATGGA ATCGTGCCGG GCAGGGTCAC GGCGGAAACC 
TTCAAGCAGA ACTGGCTGCT GGTTGCGCGG ACCTTCGCGA ACAATCCGAC CGTGATCGGC 
TACGATCTGC ACAACGAACC GAATGGCGAT CGCGGCCACA TCACCTGGGG TGGCGGCGGA 
CCGACCGACA TCAAGGCGAT GTGCGAGGAT GTCGGTTCGG CGATCCAGGA CGTCAGCCCC 
GGCGTGCTGA TCATCTGTGA AGGGCCGGAA ACCTACAAGC CGCCGCCGGC GTCATCGGGC 
ATGGACCCGC GCCACGCGGC GCCGGCGGGA AATCTCACCG CGGCGGGCGC CAACCCCGTG 
AAGCTGAAGA TTGCGAACAA GCTGGTGTAT TCGATTCACG AATATCCGGA CGAGATCTCG 
GACACCAAAC GCTGGGGGTT GCCGGAGGTT GGCAAGGGCT TCATCGACCG GATGAATTTC 
ACCTGGGGCT ATCTGGTCCG CGACAACATC GCACCGGTGT GGATCGGCGA AATGGGCGCG 
TCACTGCGAA CGCCCGAAAC GCGCGAATGG GCGCGCAATT TGATCGACTA CATGAACGGA 
AAATACGGCC AGGAGGGCGG GCCGACATTC TCGGGCGACC AGCAGCCGGT CAGCGGAAGC 
TGGTGGCTGA TCGGGCCGTC GAACGATCCG CCGTTTGGCC TGCAGACCGA ATGGGGCGTC 
GGCAACTATC GTCCCGATCA GATCGCGATC ACCGACGAGA TGCTTATGCG TCCGCGCAAC 
TAG

Protein sequence

MDAAVPSHVA DPPAIVRDAG DLRPAGRGGY LLPNGYLSTS GSQIVDASGR PVRIASIGWN 
GTEGPLGAAP SGIWRVSYKT VLDSIVAAGF NAVRIPWTDI GLNAPLNGYS DRLGWINITL 
NPELLASSTP NSQGRYQYVT TLVAFQRIVD YAQEIGLKVI FNHHTNQGTA GQQRNGLWFD 
LGPGTDNTDG IVPGRVTAET FKQNWLLVAR TFANNPTVIG YDLHNEPNGD RGHITWGGGG 
PTDIKAMCED VGSAIQDVSP GVLIICEGPE TYKPPPASSG MDPRHAAPAG NLTAAGANPV 
KLKIANKLVY SIHEYPDEIS DTKRWGLPEV GKGFIDRMNF TWGYLVRDNI APVWIGEMGA 
SLRTPETREW ARNLIDYMNG KYGQEGGPTF SGDQQPVSGS WWLIGPSNDP PFGLQTEWGV 
GNYRPDQIAI TDEMLMRPRN