Gene Phep_1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1930
Symbol
ID	8253034
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2231564
End bp	2233351
Gene Length	1788 bp
Protein Length	595 aa
Translation table	11
GC content	43%
IMG OID	644935581
Product	hypothetical protein
Protein accession	YP_003092200
Protein GI	255531828
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.171186
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0291599
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTAA AACTTACGCT CATCCTGTCC ATCCTTACCG GATACCTGCA AGCCCAGATG 
CCACTTGCCC CTTCTAAACA CAATTTAGAA AAAAGAGTAA GTATAGAAGT AAAAAATACC 
CAGATATCAG AAGTACTCAC CAGGGTTAGC CGCGCCGGGG CATTCTATTT CTCTTACAGC 
GGGGCCTTGT TCACAACAGA TAGCCTGGTT AGTCTGAATG TCAGAAATAC GCCGGTAAGG 
GAAATATTGG ACAGGCTTTT TAACAATAAG GTAGATTACA AGGAAAACGG GGAATATATC 
ATTCTCCGTT ATGCAGCAAA CCACCTTACC ATAGAACCTG AAAACATCAC CACTGCCGAC 
AAGCTTTACC TGATCAGTGG TTATGTAATA GATACAGAAA CGGGTCGTAA GGTTAAACAG 
GCCAGTGTTT ATGAAAAACG TCTCTTGCAG TCTACACTTA CAGATCATGA GGGCTTCTTT 
AAACTGAGGT TTAAAGGTGA CCATAATGAA GTGATATTAA CAGCTGCCAA AGAAAACTAC 
AGAGACACCA CGCTCGTCTT CCTATCTGAC ATTAAAGTGA AACCAGAGGG TTATAAAGAC 
CCAAACGCAG ATGAAGCAAA TGGTCTGTTC AGTGATGTCG AAAATTCGGG AATCGGCAGG 
TTCTTCATTT CTTCCAAACA AAGGATCCAG AGTTTAAACA TCCCCAGTTT TTTTGCCAAC 
AGTCCTTTTC AAACTTCACT TACACCGGGT TTAAGCTCCC ACGGCATCAT GAGCTCCCAG 
GTGGTCAACA AATTTTCACT GAATGTTCTG GGTGGTTATA CCGCAGGCAC AGATGGACTT 
GAAATTGCAG GGCTTTTTAA CATTACCAAA GGTGATGTGA AGAAATTACA GTTTGCTGGT 
CTTTTTAATG AGGCTGGCGG CGCTGTAAAC GGTTTTCAGG TGGCAGGTTT ACTGAACAAT 
GTAAGTGGCG AAAAGAAAGG CTTCCAGGCA GCCGGACTGC TTAACCGTGT TAAAGGTGAA 
ACTGAAGGCT TTCAGGTTGC CGGGCTTTGC AACTTGTCGG CCAGGAGTAT GAAGGGTGTA 
CAGGCAGCAG GAATTGTAAA CGTTATTAAA GAAAATGTTG ATGGGGTACA AATTGCTGGC 
ATTGCCAACC TGGTACGCAA AGACATGGAA GGCATCCAGA TAGCTGGCAT AGCTAATATG 
ACCAGGCACT TAAAGGGGGT ACAAATTGCT GGTATTCTTA ACTATGCCAA AAAAATGGAT 
GGTTTCCAGC TTGGCCTTAT CAATGTATCA GACACTTCAT CCGGTTACAG TTTAGGGTTG 
ATAAACCTTG TAAAACATGG TTATCATAAA ATAAGCCTGT TTACCAACGA AACTGTAAAC 
ACCAATCTTT CTATTAAAAC AGGCAATTCC CATCTTTATA CCATTTTATT TGCAGGCTTA 
AACCTGTCAC AAAACGAAAA AGTACGAACT GTGGGTATAG GCCTTGGCCA TGATTTTATT 
TTTAACAGCT GCTTGTCTGT TGGTCTTGAA ACAACTGGTC AGCTGCTCTA TCTCGGTAAG 
TGGGACAGTA CCAACCTTTT GAGTAAAGTT CAGGCCAACC TGCAGGTACA GCTGGTTAAA 
GGTATAAGCC TCTTTGCGGG CCCTGCCTAC GCTGTTTACA GCAGCGATAA CCCCGCCAAT 
TCCAGTTCAG CAGGCTATAA GCAAAACATT GTTCCAAAGC ACCATACCAG CTTTGGCAGC 
AACACAAAGG GATGGCTGGG TTTCAATGCC GGCATCACCT TCATGTAA

Protein sequence

MKLKLTLILS ILTGYLQAQM PLAPSKHNLE KRVSIEVKNT QISEVLTRVS RAGAFYFSYS 
GALFTTDSLV SLNVRNTPVR EILDRLFNNK VDYKENGEYI ILRYAANHLT IEPENITTAD 
KLYLISGYVI DTETGRKVKQ ASVYEKRLLQ STLTDHEGFF KLRFKGDHNE VILTAAKENY 
RDTTLVFLSD IKVKPEGYKD PNADEANGLF SDVENSGIGR FFISSKQRIQ SLNIPSFFAN 
SPFQTSLTPG LSSHGIMSSQ VVNKFSLNVL GGYTAGTDGL EIAGLFNITK GDVKKLQFAG 
LFNEAGGAVN GFQVAGLLNN VSGEKKGFQA AGLLNRVKGE TEGFQVAGLC NLSARSMKGV 
QAAGIVNVIK ENVDGVQIAG IANLVRKDME GIQIAGIANM TRHLKGVQIA GILNYAKKMD 
GFQLGLINVS DTSSGYSLGL INLVKHGYHK ISLFTNETVN TNLSIKTGNS HLYTILFAGL 
NLSQNEKVRT VGIGLGHDFI FNSCLSVGLE TTGQLLYLGK WDSTNLLSKV QANLQVQLVK 
GISLFAGPAY AVYSSDNPAN SSSAGYKQNI VPKHHTSFGS NTKGWLGFNA GITFM