Gene Phep_4100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4100
Symbol
ID	8255234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4942804
End bp	4944720
Gene Length	1917 bp
Protein Length	638 aa
Translation table	11
GC content	42%
IMG OID	644937764
Product	RagB/SusD domain protein
Protein accession	YP_003094353
Protein GI	255533981
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATG CTATAAAAAG GCAGTGGTGC TTAAAAGTTG CCATCCTTAT TGTTATTTCC 
GGATTAAGTT CCTGTAAAAA ATATCTGGAC ATTATCCCTG ATAACGTCGC AACCATAGAC 
AATGCATTTG CGATGCGCTC AGAAGCGGAA AAATACCTCT ATACCTGTTA TTCTTACATG 
CCAAAGGATG GTAGCCTAGA CCAGGACCCT TCAATTTTAG GTGGCGATGA AATATGGGCA 
ATTGACCGTC CGCCAAAACC AAATTTCAAC CATGGAATTT TTGAAATTGC AATGGGGCGT 
CAGGCTACGG TTAATCCTGT CGGAGAATTT ATTTGGGTAA ACCTCTATAA AGGCTTGCGC 
GACTGTAACA TCTTCCTGGA AAATGTAGAG AGGGTACCCG ACCTTAAGCC AGAAGAAAAA 
AGAGAATGGA TTGCTGAGGT CAAATTCCTT AAAGCTTATT ACCATTTTTA TCTGGTACGT 
ATGTATGGGC CAATTCCGCT GATCAAAGAG AATTTGCCGG TTGATGTAAA CATCTCCTCT 
GTGAAAATTA CCAGAGCACC TGTAGACAGC TGTTTTGCTT ATATCAAGCA ATTGCTCGAT 
GAATCAAAAG ATGTATTACA GCCTACCATC AATGATCCGG TTAAAATGCT GGGCCGTATC 
ACCAAACCTA TTGTGTATTC TTTAAAGGCT AAAGTTATGG TAACGGCTGC AAGCCCATTG 
TTTAATGGAA ATGCCGATCA GGCCAGTTTA AAAAACGCTG ATGGGACACA ACTATTTAAC 
CAGCAGGTGG TTCCTGCTAA ATGGGATTCG GCTGTAGTAG CCTGTAAACA GGCAATAGAC 
GTATGCGAGG CAGCAGGGTT AAAACTGTAT GAGTTCAATG CGGCTTCATC AACCTTCGTG 
TTGTCGGATC AGATGAAATT GCAACTCAGC TTAAGAAATG CTTTCGCAGA AAAATGGAAT 
TCTGAAATTA TCTGGGCAAA TACCCAAAGC CTTTCAGCTA ACATCCAGTT AAATGCAACA 
CCTAATGTCA ACCCATTATA CCAGGACAAT CCCTTCATTG GATACGAACT GGCCCCGCCG 
TTAAAAATCG TAGACATGTT TTACACCGAG AATGGCGTAC CTACAACGGA AGATAGGACC 
TGGAACCTGA ACCAGCCAGC TACAAGGGCA GGTACGGTTG AAGATCAGCG GCTCATTAAA 
TTAAATTATG AAACCTCCTC TGTCAATTTC GACCGTGAGC CACGTTTTTA TGCCAATCTG 
GGCTTTGATG GGGGCATTTG GTACGGACAG GGTTATTTTA ATGATGCAGT ACCTGCAAGT 
ACATATTATG TAATGGCCAA AAAGGGGCAG CAAAATGGTA AAGGAAAACC AGATTATGGT 
TCGGTAACTG GCTATTTTAT TAAAAAATAC GTGCATTATC AAAATACCCA GGGTAGTGCA 
ATGACCGATT ATAGCGTCAA CAATTATCCG TGGCCGTTAA TCCGTTTGTC GCAATTATAT 
CTGTTATATG CAGAAGCACT GAATGAGAAA AGCGGACCTG TTGCAGAAGT ACATACTTAT 
ATCAATAAAG TACGTGCCCG GGCTGGTCTC AAATCAGTTA AAGAATCCTG GGATCTGTAT 
GCAAATAATA CCAAGTACAC GACTCAGGCC GGGATGAAAG ATATTATCCA CAGGGAAACC 
TTAATAGAGC TTGCTTTTGA AGGTGCCCGT TTCTGGGATC TTAGAAGATG GAAAGAAGCT 
CCTCAGGAGT ATATCAAGCC GATTCAGGGA TGGGACATCG AGCAGTCTAC TGCAAATTTA 
TACTACCGCA GAAAACTGGT GTTTACACCC AGATTTTCAA TGAAAGACTA TTTCTGGCCG 
ATTCGTGATA ACAATATCCT GAACAATAAG AATTTAATCC AAAATATTGG TTGGTAA

Protein sequence

MKYAIKRQWC LKVAILIVIS GLSSCKKYLD IIPDNVATID NAFAMRSEAE KYLYTCYSYM 
PKDGSLDQDP SILGGDEIWA IDRPPKPNFN HGIFEIAMGR QATVNPVGEF IWVNLYKGLR 
DCNIFLENVE RVPDLKPEEK REWIAEVKFL KAYYHFYLVR MYGPIPLIKE NLPVDVNISS 
VKITRAPVDS CFAYIKQLLD ESKDVLQPTI NDPVKMLGRI TKPIVYSLKA KVMVTAASPL 
FNGNADQASL KNADGTQLFN QQVVPAKWDS AVVACKQAID VCEAAGLKLY EFNAASSTFV 
LSDQMKLQLS LRNAFAEKWN SEIIWANTQS LSANIQLNAT PNVNPLYQDN PFIGYELAPP 
LKIVDMFYTE NGVPTTEDRT WNLNQPATRA GTVEDQRLIK LNYETSSVNF DREPRFYANL 
GFDGGIWYGQ GYFNDAVPAS TYYVMAKKGQ QNGKGKPDYG SVTGYFIKKY VHYQNTQGSA 
MTDYSVNNYP WPLIRLSQLY LLYAEALNEK SGPVAEVHTY INKVRARAGL KSVKESWDLY 
ANNTKYTTQA GMKDIIHRET LIELAFEGAR FWDLRRWKEA PQEYIKPIQG WDIEQSTANL 
YYRRKLVFTP RFSMKDYFWP IRDNNILNNK NLIQNIGW