Gene Phep_0213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_0213
Symbol
ID	8251298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	250351
End bp	252357
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	44%
IMG OID	644933863
Product	TonB family protein
Protein accession	YP_003090501
Protein GI	255530129
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.110035
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACAG CACATTACAT CCTGCAGGTC AACATCTACT TAATTGTATT TTATGGCTGC 
TATAAGGTAT TGTTAGACAA AGAAACTTAT TTCCTCCTCA ACAGGATTTA CCTGCTTGCT 
GCGGGTTTAC TTTCCCTGGC CATTCCCTTT TTAAGGTTCG AATGGTTTGC CACGCAGCCT 
GTTGCCCAAC CGCTCTACGT TGGGGTAGAC CAGCTGAACA GTCTGATGAC CCAGGTAATT 
GTGGCGCCCC AAAAGCCTGA AAGCTATAGC CCCGGCAACC TTATCGTGAT CCTTTACCTG 
GCAGGCATCC TGTTTTTTAC GGGTAAACTG ATCTGGCAAT TGCTTACCGT AGGAAAACTT 
CTGAAAAAAA CAGGCCCGGG TACAGCATTT TCTTTTTTTG GCCAGAAAAG GATCGATAAC 
AATTTGCCCC AGCTGCAAAC CATCCACAAA CACGAAGAAG TACATATCCG CCAGCTGCAC 
AGTGCCGATG TATTGTTTTT CGAGCTGCTG GGCATATTTA CCTGGTTCAA TCCGGTCGTC 
TATTTTTACA AACGTTCCTT AAAGAATATC CACGAGTACC TGGCCGATGA AGCAGCAGCT 
ACCTTTCAGG GCGATAAAAA AGCTTATGCC CTGTTATTGC TCAGCAGTGC CTTCGGCGTA 
CCTGCCAGCA AACTAACCAA TAGTTTTTTT AGTAAGTCAT TGATCAAAAA GAGAATATTT 
ATGCTCCATA AACAAAGATC CAGAAAAACA GCCATTTTAA AATATGGTAT GTTTGTACCG 
CTTCTAGCCC TCGCACTCAT CATGTCGTCG GCCACCATCC GCAACAATGT CCAGATCCAG 
CAAATTGCAA ACGAGATCCC CCTAAACAAT CCGGTTGAGG TGGTTAAAGA AGTGGTAACC 
CCCGTACTGC AACAGGCTGT AACTGAAAGG GTGAAAACCG CTAAAAAAAC ACCTCAGGAA 
ATTGTCCTTG TGCCAGCTGC CGAAAAACCT GTGCAAACAG CAGCAACGCC CGACTGGAAC 
AATTTTTACA AGTTCATTAA AACAATTATA CGCTATCCCT CAATTGCCCG GCAACAAAAA 
ATACAGGGCA GCACCATCAT TAAATTTACC ATAGCAGATG GCCAGCTCGA AAATATAGGT 
ATCGCAGCAA AATTAGGCGG AGGCTGTGAC CTTGAGGCCA TGAGAACCAT CACCGCATTT 
CCGATGTATA AAGGCACAAT GGATGGAAAT TACAGTATAA AGATCAAGTA TATCCTCAGT 
GATACCAATA CCCCTAAAAT AAATGAAAAT ACAGCAGCCC CAAAGGACTA TACCCCATTA 
AATGACATCA TGGTGGTAGC TTATGGCGGT TCTGAGACAG AGAATGAAGA CAAGGTCTAT 
GATTTCGTGT CCATCGACAA ACAACCGGGA TTCGAGGGTG GTATGCAGAA TTTCTATGCC 
TACCTGAAAA AAGCGATCCG CTATCCTGCA GAAGCACAAA AGAACAACAT TCAGGGCAAA 
GTGTTTTTAT CCTTTATTGT AGAAAGGGAT GGCACCCTAA GTGACTTTAA AGTGGAAAGA 
AAACTGGGAA GCGGCACAGA TGAAGAAGCC ATAAGGGTAT TGAAAGAATC GCCGAAATGG 
ACACCAGGGA TGAAGAACGG CAAAGCAGTA CGTGTTAAAT ACAATATCCC CATCAGCTTC 
ACGCTAAACA ATGGAGCTAC CCAGGTCCCG GCAGTCAATT TAATCGGGAA CAATAGCGGC 
ATTATCTTCA AAGATGCCAA TGGCGGCCAG ATGAAATTTG GTGACAATGC CGCAAATTCA 
CCACTTGTTG TAATAGATGG TAAAATACAG GACAAATCAG ATCTTTCTTA CATGAATCCA 
GATGATATTG AATCCATCAG TGTTTTTAAA GATGCAAAAG GAACAGCACT ATATGGTGCC 
AGAGCTGCAA ACGGTGTCAT TAGCATTACC ACAAAAGCAG GCAAAGCCAC CAAAACCCCT 
GCAACGAATA AAAAGACAGG CGAATAA

Protein sequence

MSTAHYILQV NIYLIVFYGC YKVLLDKETY FLLNRIYLLA AGLLSLAIPF LRFEWFATQP 
VAQPLYVGVD QLNSLMTQVI VAPQKPESYS PGNLIVILYL AGILFFTGKL IWQLLTVGKL 
LKKTGPGTAF SFFGQKRIDN NLPQLQTIHK HEEVHIRQLH SADVLFFELL GIFTWFNPVV 
YFYKRSLKNI HEYLADEAAA TFQGDKKAYA LLLLSSAFGV PASKLTNSFF SKSLIKKRIF 
MLHKQRSRKT AILKYGMFVP LLALALIMSS ATIRNNVQIQ QIANEIPLNN PVEVVKEVVT 
PVLQQAVTER VKTAKKTPQE IVLVPAAEKP VQTAATPDWN NFYKFIKTII RYPSIARQQK 
IQGSTIIKFT IADGQLENIG IAAKLGGGCD LEAMRTITAF PMYKGTMDGN YSIKIKYILS 
DTNTPKINEN TAAPKDYTPL NDIMVVAYGG SETENEDKVY DFVSIDKQPG FEGGMQNFYA 
YLKKAIRYPA EAQKNNIQGK VFLSFIVERD GTLSDFKVER KLGSGTDEEA IRVLKESPKW 
TPGMKNGKAV RVKYNIPISF TLNNGATQVP AVNLIGNNSG IIFKDANGGQ MKFGDNAANS 
PLVVIDGKIQ DKSDLSYMNP DDIESISVFK DAKGTALYGA RAANGVISIT TKAGKATKTP 
ATNKKTGE