Gene Phep_2747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2747
Symbol
ID	8253855
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3244545
End bp	3245795
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	50%
IMG OID	644936395
Product	Ribulose-bisphosphate carboxylase
Protein accession	YP_003093010
Protein GI	255532638
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.32552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAGAA TAACCGCAAA ATATTACATA GAAACGCCGC TTGATCTCGA AAAATCGGCC 
CAGTTGCTGG CCGGCGAGCA AAGTTCAGGA ACCTTTATTG CCGTGCCGGG CGAAACCGAA 
GAATTGAAAC AGCGCTTTGC CGCCAGGGTA GAAAGCATTA CCCCAATGGA TACAGCTAAT 
GAACCCGCCA TACCAGGCGT ACTGTCTGCC GGCGGTAAAT ACCAGCGCGC TATGATCGAG 
GTTTCCTGGT CGATAGAGAA TTTCGGCTAT AACCTGCCGG TGATGGTGTC TACCCTGCAG 
GGAAATTTAT ATGAGCTGAC CCAGTTTACA GGGCTTAAGC TGATGGATCT GGAATTGCCA 
GCTTCTTTTG CTACCGCCTT TAAAGGGCCT AAATTTGGCA TAGCCGGCTG CAGGAAACTG 
ACAGGTGTTT ACAACAGGCC CCTGATCGGA ACCATCATCA AACCCAGCAT CGGCATGACG 
CCGGAACAAA CGGCTGCTTT GGTAAATACC CTTGCCCTGG CTGGAATTGA TTTCATCAAG 
GATGATGAAC TGCTGGGCTC ATCTGCCAAT TCCCCCTTTG ATAAACGGGT GGATGCCATT 
ATGGAAGTGA TCAACAGACA TGCTGATCGC AGCGGAAAAA AAGTAATGTA TGCTTTTAAC 
ATCAGCGATG ACATCGACCA GATGCAGCGC AATTACGAAA AGATCCTTCG TTCAGGGGGT 
ACTTCAGCGA TGATAAGTCT CAATAGTGTT GGGCTGGCAG GGGTTAAGAA GATTGGCGAA 
ATAGGGGAGC TGGCTATTCA TGGCCACCGT AATGGCTGGG GTATGCTCAA CCGTCACCCT 
TTACTGGGTA TAGAGTTTCC TGCCTATCAG CAGCTTTGGC GTTTGGCCGG GGTCGACCAG 
ATCCATGTAA ATGGCATACA AAACAAATTC TGGGAATCTG ACGATTCTGT AGTGCGTTCT 
ATTGAAGCCT GCTTCAAACC CTTATTGGGT GGCTATTCGG TTTTACCAGT GGTATCCTCG 
GGGCAGTGGG GCGGGCAGGC TGTTGAAACC TACCGGCGCG TACCCTCTGT AGACTTGTTA 
TATATGGCCG GAGGTGGAAT TATGGCGCAT CCAGACGGTC CTGCAGGTGG CGTAGTAGCT 
TTACAACAGG CCTGGCAAGG TGCTGTAGAT GGCCTGTCAG TGGCTGAAAC AGCTGCAAAA 
TATCCTGAAT TTGGACATTC GGTAAGTGTA TTCGGTAAAA AACAGGCCTA G

Protein sequence

MERITAKYYI ETPLDLEKSA QLLAGEQSSG TFIAVPGETE ELKQRFAARV ESITPMDTAN 
EPAIPGVLSA GGKYQRAMIE VSWSIENFGY NLPVMVSTLQ GNLYELTQFT GLKLMDLELP 
ASFATAFKGP KFGIAGCRKL TGVYNRPLIG TIIKPSIGMT PEQTAALVNT LALAGIDFIK 
DDELLGSSAN SPFDKRVDAI MEVINRHADR SGKKVMYAFN ISDDIDQMQR NYEKILRSGG 
TSAMISLNSV GLAGVKKIGE IGELAIHGHR NGWGMLNRHP LLGIEFPAYQ QLWRLAGVDQ 
IHVNGIQNKF WESDDSVVRS IEACFKPLLG GYSVLPVVSS GQWGGQAVET YRRVPSVDLL 
YMAGGGIMAH PDGPAGGVVA LQQAWQGAVD GLSVAETAAK YPEFGHSVSV FGKKQA