Gene Phep_3367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3367
Symbol
ID	8254486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	3996069
End bp	3999170
Gene Length	3102 bp
Protein Length	1033 aa
Translation table	11
GC content	42%
IMG OID	644937019
Product	TonB-dependent receptor plug
Protein accession	YP_003093623
Protein GI	255533251
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1629] Outer membrane receptor proteins, mostly Fe transport
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.994528
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCAA GAGCGTACTT ATTACTGGTA TTTTTTCTTT TTCCAATGTG GGTCTGTGCA 
CAGCAGCAGA TTGTGGGAAA AGTTGTGGAT GTAAGGGGAG AACCTTTACC TGGAGTTAGT 
GTCACTGCAA AAGCAGATGA CGGACAAAAA TTTAATGCAA TTACCAATTC AAATGGTGAT 
TATGATTTAC GTGTTTCTGG TGGCACCAAA GAATTAACCT ATACGTATAT GGGTATGATG 
CCAGTTACGG AGCTCATAAA GGGCCGTAAC ACCATAAACG TACAGCTGGC TGAAGACAGC 
AAGGAACTGC AAAATGTAGT AGTAACAGCC CTAGGTATCA AACGTGAAAT AAAAGCCTTG 
AGCTATAGCA GGCAAGGGGT AGATGTAAAC ACGATGACGG AAGCTAAAAG CCCGAACTTG 
TTGAGTACCT TATCTGGAAA AATTGCAGGC TTACAGATTG TACCACCTGG TTTTAATACA 
GGTTCGGCCA GGGTTGTTAT CAGGGGTAAC AGTTCACTGA CCGGAAACAA CCAGCCACTT 
TTTGTGGTAG ACGGGATGCC GATAGACAAT ACGGCAGGGG ATGGCAACAT CGATTATGGA 
AATAATGCTG CTGATATCAA TACTGAAGAT ATTGAAAATA TAGAAGTGCT TAAAGGTCCG 
AATGCTTCGG CACTTTATGG CTCAAGGGCA GCTAATGGGG TAATTTTGAT TACTACAAAA 
AAAGGCACTA CTAAATTTAA GGTGTCGCTT AATTCGAGTT TAATGATGCA GAGATTAACC 
GAATTTCCAG AATACCAAAA TGCTTACGGA GTAGGGACTT CATTTTACAT TGACAATACA 
CATCGCTTGC CTGAAGCCAT GGTTAATTAT CGCAGTTGGG GGTCGCCTAT GATGGGGCAG 
CCTTATGTTG CTTTAAATGG TGAAATCAAA CCCTACCTGC CACAGCCGGA TAACATTCGG 
GATTTTTATC AGTCTGCTTC ATTGCTGACC AATAATATCG CCGTAGAAGG TGGGAATACA 
AGTAGTATTT ACAGGATTTC CTATACCAAT TATGCCGGAT CCAGTGTAGT GGATGGATTT 
AACCTGAGCA ATAAGCAAAC CGGAGACGTA CGCCTGCAAA ATACTTTTAG TAAAAAGGTG 
AGCCTGGACA GTAAAATCAG TTACGTAAGA GATGCGGTTG ACAACAGACA GTATTCGAAT 
GCGAATGGCC GGAATCCAAC AAACCTGTAT ACGCATATGG GCAGGAGTAC TGATCTTGCC 
GAACTCATGC CCTATAAAGA CCCACTAACC GGAATGGAAA TAGGGACGCA TCGTAATTTC 
AGCAATCCTT TTTGGGTAAT TAATGAGAAC CCCAACCGGG ACGTTAAAGA CCGTATAATT 
GCATCTTTGA ACCCTAAAGT GAATTTCACC AATTGGCTGG TTTTTAATGG ACGCTTAGGT 
GCCGACGTGC TGTGGTGGGA TGGTTTTGAA TTTAATAATA TTGGTTCTAT TGTGGCCAGC 
AACCCTGATG GTTTTATGCG TACCTTTAAT ACCAAGCAGC AAAATTTTAA CCTGGAAGGT 
ACGCTTGTAG CCAATAAGAC CTTTAATAAA TTTTCGGTGA GTACCATGCT GGGTGCCAGT 
AGTTTTAGCT CTTGGTTTGA AAGAAGGGAA CAAAGGATCA ATTCTTTATT GCAGCCTGGC 
TTAATTAATT TATCCAACGC CAAAGAGTTT CCAACGGTTA CGCAACAGCA ACGTGATAAA 
CGTTTAAACT CTGTTTTTGG TTCTGTTTCT TTAGGTTACA GAGGGTATGC TTTTGTTGAT 
GTAACAGGTA GAAACGATTG GTCATCTACA TTGCCGAGGG CTAATAATTC TTACTTCTAT 
CCCTCCGTTG GCGGCTCATT GATTGTGAAT GAAATATTAG GTTTGAAGAG CGACATCCTT 
AGTTTTGCCA AATTGCGCGC ATCTTATGCC ATCGTAGGAA ATGATACCGA TCCGTATAGA 
TTAGACCAGA CTTACTCATT TAATGGTTTT TTAAATGGGG CCACCCTGGC TTCACTGGCC 
ACTACAATGA ACAACGCAGA TCTTAAGCCC GAAAGGACAA CGTCTTTTGA GTTAGGAATG 
GATGTAAGGT TGTTTAAAAA TAGGGTTTCA ATCGATGGCA CCTATTACAA TGCTGCTACT 
ACTAACCAGA TTGTAACAGC TCAGCTTCCA TCTTCAAGCG GTTATTTAAA GCGAATTTAT 
AATGCCGGAA AAATAAAGAA CTGGGGTTAT GAACTGAGCG GAAATGCAAA GGTTATTGCC 
GGGAAGAACT TTTCATGGAC AACCCAGCTT AATTATGCGG CGAACAATTC GAAGGTAGTA 
GAGCTGATAG AGGGGATTGA TCGTTTCCAG CTGAATAACA ATTCGAGTTA CCTGTATGTA 
TATGCTGAAG TGGGAAAACC ATATGCCTAT TTGCGGGGTT TGGGAGTGGC CCGCGATGCC 
CAGGGCAGGA TGTTGATCGA GGATGGGGGA TCCTTATTGG TTAAGGATAA TGACATGGCC 
TTTGGAACGG CTTCACCGGA TTGGATTGGT GGCATTTACA ATACTTTTAA GTTTAAAAAT 
CTGGACCTCG GTTTCCTGGT AGATGTTAAA ATGGGTGGGG TAATGTATTC TGGTAGTATT 
TCGCGAATGC TGACGAACGG TGTTTTAGCG GAAACCTTAT ACGGACGCGA TGATTATTAT 
AAACATACCG TGATTTTTGG GGAGAACAAT ACAGAGTTAA GTGGTGGTGC AATATGGGAT 
GCCTATTTTG CGGATGGGAC TAAAAATACG AAGTTCGTTA CCCCTCAGAA CTACGAATAT 
GCAAGGCCGA ATTATGCAGA ATTTGTGATC TACGATGCGT CTTATGTAAA GCTAAGAGAA 
GTTACGGTCG GTTATACATT ACCTGTTAAG CTGTTGTCGA AAATGCCGGT TAAAACGGCA 
AGGTTCTCTT TATCCGGCAG GAACCTGGCT ATTCTTTATA GAAGAACCCC ACGTGGCCTG 
GATCCTGAAG CAATGTCTAC CTCTGGTAAC GGACAGGGAA TTGAGAATGG TGCGTTGCCT 
CCGAATGCAA TTTATGGATT GAATATCAGA CTTACTTTTT AA

Protein sequence

MKARAYLLLV FFLFPMWVCA QQQIVGKVVD VRGEPLPGVS VTAKADDGQK FNAITNSNGD 
YDLRVSGGTK ELTYTYMGMM PVTELIKGRN TINVQLAEDS KELQNVVVTA LGIKREIKAL 
SYSRQGVDVN TMTEAKSPNL LSTLSGKIAG LQIVPPGFNT GSARVVIRGN SSLTGNNQPL 
FVVDGMPIDN TAGDGNIDYG NNAADINTED IENIEVLKGP NASALYGSRA ANGVILITTK 
KGTTKFKVSL NSSLMMQRLT EFPEYQNAYG VGTSFYIDNT HRLPEAMVNY RSWGSPMMGQ 
PYVALNGEIK PYLPQPDNIR DFYQSASLLT NNIAVEGGNT SSIYRISYTN YAGSSVVDGF 
NLSNKQTGDV RLQNTFSKKV SLDSKISYVR DAVDNRQYSN ANGRNPTNLY THMGRSTDLA 
ELMPYKDPLT GMEIGTHRNF SNPFWVINEN PNRDVKDRII ASLNPKVNFT NWLVFNGRLG 
ADVLWWDGFE FNNIGSIVAS NPDGFMRTFN TKQQNFNLEG TLVANKTFNK FSVSTMLGAS 
SFSSWFERRE QRINSLLQPG LINLSNAKEF PTVTQQQRDK RLNSVFGSVS LGYRGYAFVD 
VTGRNDWSST LPRANNSYFY PSVGGSLIVN EILGLKSDIL SFAKLRASYA IVGNDTDPYR 
LDQTYSFNGF LNGATLASLA TTMNNADLKP ERTTSFELGM DVRLFKNRVS IDGTYYNAAT 
TNQIVTAQLP SSSGYLKRIY NAGKIKNWGY ELSGNAKVIA GKNFSWTTQL NYAANNSKVV 
ELIEGIDRFQ LNNNSSYLYV YAEVGKPYAY LRGLGVARDA QGRMLIEDGG SLLVKDNDMA 
FGTASPDWIG GIYNTFKFKN LDLGFLVDVK MGGVMYSGSI SRMLTNGVLA ETLYGRDDYY 
KHTVIFGENN TELSGGAIWD AYFADGTKNT KFVTPQNYEY ARPNYAEFVI YDASYVKLRE 
VTVGYTLPVK LLSKMPVKTA RFSLSGRNLA ILYRRTPRGL DPEAMSTSGN GQGIENGALP 
PNAIYGLNIR LTF