Gene RPC_2510 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2510
Symbol
ID	3971092
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	2722769
End bp	2723797
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	68%
IMG OID	637925618
Product	Beta-N-acetylhexosaminidase
Protein accession	YP_532380
Protein GI	90424010
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.327504
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAACA GGCGCGCATT TATTACCGGT GTGTCCGGCA CCGTTTTGAC CGCCGAGGAA 
CGCGCGTTCA TTCGCACGAC CCGGCCGTGG GGTTTTATCC TCTTCAAGCG CAATATCGAT 
ACGCCTCAGC AAGTCTCGAA ACTTGTTGCG GAATTGCGCG CGGAGGCGGA CTTCCCCGAG 
GCCCCGGTGC TGATCGACCA GGAGGGCGGA CGGGTGCAGC GGCTCGGCCC GCCGCACTGG 
CCGGTGTATC CGCCGGGGGC GATCTTCTCC ACGCTCTACG ATATCGATTC GCAGCTCGGC 
CTCGCCGCGG CGCGGCTCAG CGCGCGGCTG ATCGCGGCCG ATCTGATCGA TCTCGGCATC 
ACGGTGGACT GCCTGCCGCT GGCCGACGTG CCGGTTGCGG GCGCCGACGC GGTGATCGGC 
AATCGCGCCT ATGGCAACGA GCCGGGCAAG GTCGCGGCGA TCGCCCGCGC CGTCACCGAC 
GGCCTGGCGC AGGGCGGCGT GCTGCCGGTC CTGAAGCACA TTCCCGGCCA TGGCCGCGCC 
ACCGCCGACA CCCACCATGC GCTGCCGGTG GTCGACACCC CGCTGGCCGA GCTGCAGCGC 
ACCGACTTCG CCGCCTTCCA GCCGCTGGCC GATCTTGCGA TGGCGATGAC CGCACATGTT 
GTGTTTAGCG ACCTCGATGC CGCCCAACCC GCGACCACTT CTGCGACAAT CATCGAACGT 
GTGATTCGCG GGACGATCGG GTTCCAGGGG CTATTGATGA GCGACGACGT CTCGATGAAT 
GCGCTGGCCG GAACGATCGC CGAGCGCAGC CGCGCCATCG TTGCGGCCGG CTGCGACATG 
CTGCTGCACT GCAACGGCAA GCTCGACGAA ATGCAGGCGG TGGCCGCCGA GGCGCCGTGG 
CTTGTCGACG AAGCCAAGGC GCGCGCCGAC CGCGCGCTGG CTCAGCGTCA GCAACCGCAG 
CCGTTCGACC GCATCGCGGC ACGCAATGAA CTCGACGCCC TGATCGGCCG AGCTGGAGTG 
GGCGCATGA

Protein sequence

MMNRRAFITG VSGTVLTAEE RAFIRTTRPW GFILFKRNID TPQQVSKLVA ELRAEADFPE 
APVLIDQEGG RVQRLGPPHW PVYPPGAIFS TLYDIDSQLG LAAARLSARL IAADLIDLGI 
TVDCLPLADV PVAGADAVIG NRAYGNEPGK VAAIARAVTD GLAQGGVLPV LKHIPGHGRA 
TADTHHALPV VDTPLAELQR TDFAAFQPLA DLAMAMTAHV VFSDLDAAQP ATTSATIIER 
VIRGTIGFQG LLMSDDVSMN ALAGTIAERS RAIVAAGCDM LLHCNGKLDE MQAVAAEAPW 
LVDEAKARAD RALAQRQQPQ PFDRIAARNE LDALIGRAGV GA