Gene Phep_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3874
Symbol
ID	8255008
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4654484
End bp	4656190
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	45%
IMG OID	644937538
Product	RagB/SusD domain protein
Protein accession	YP_003094127
Protein GI	255533755
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.483678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTA AAAGATTTAT GTTAGGGTTG ATGGCAATTC TAACCACCTT TATGGGCTGT 
AAGGATTACC TGGACAGGGA AATTCCAACT AATGTTAAGG ACGATCAGGT ATTTGTGAAC 
TATGACCGCA TTTCACAGGC AGGATATGGG GCTTATGCCT TCCTTTTTAA TACCATTGGC 
TATAACCGGA TCAATGGTGC CATGCTGGCC TCAGGTTGTG ATGAAGCCGA TCATGCAGAC 
AATATTTCAA GTATTCAGCG GTTTAATACG GGCACCTGGA ATGCTACATT TAATCCTGAA 
GATGTATGGG GACTGTTTTA CCAGGGCATC AGGCGGGCAA ATCTTTTTCT GGAAGAATCG 
GCAGATTTTA AAAACCTGAT CTACAGAGAT ACCATTAATG TAACCAATAA AGACCTTTAT 
AAATACAGAG TACGGGATTT AGAATGGTTA AGGGCCGAAA ACCGCTTTTT ACGGGCATAT 
TACTATGCTG AGCTTATTAA ACGTTATGGG GGAGTACCTA TTCTGCTAAA ATCTGTAACG 
GATATTGATG AACTGAATAC TTATAAGCGA AAAACTTATG AGGAATGTGT TCAATTTATT 
TCCGATGAGT GTGATGCGGT AGTGCCCCTG CTGAACGAGA GCTGGGTAGG TTTTGATGGC 
GACAAGTGGC GTGGCAGGGT AACCAAAGGA GCGGCAATGG CATTGAAAGC AAGGGTATTG 
CTATATGCTG CCAGTCCGCT TAATAATGCA TCCAATGATA TTACCAAATG GCAAAAGGCC 
GCAAAAGCAG CGCACGATGT AATTGCCCTG AATAAGTATG GCTTGCATAC TGACTATAGA 
GGATTGTTTA GGTTGGGGAA TGGGGCTGAT GGAAACCCGG AGATCATTTT CGCACAGCAG 
GGTTATAACA GAAACGATTA TGAAAAATAC AATTACCCTA TTGGCTATGA CCAGGGGGGG 
TTAGGGAGCA CCTCTCCATC ACAGAATCTG GTAGATGCTT ATGAAATGAA AACTACGGGC 
CTTGCTATAA CTGAAAATGG GTCAGGTTAT GATCCGGCCA ATCCATATGC GAACAGAGAT 
CCACGCTTAG GGCTTAGCAT ACTGGTCAGC AATACTTCCT TTAAAGGACG CCCGGTGGAA 
GCCTGGGTAG GTGGTTTGGA TGGGCTTGGT AAATTTAAGG CAACTACGAC CGGTTACTAT 
ATCCGCAAAT ACGTGGACGA AAACCTGAAC CTGGCCCAGG GGGCGACCAG CTTGCATACC 
TGGATGATTT TCCGGTATGC AGAGGTGCTG TTAAACTATG CCGAAGCGAT GAATGAAGCT 
TATGGCCCCG ACGTTACGGC CGGTTATAGC ATGTCGGCAA AAAAAGCCGT AGATATGGTC 
AGGGCCCGGA CGGGTATTGC TATGCCACCT CTTCCTCCCG GTCTTTCAGT TGATGAAATG 
CGTTTACGCA TCAGAAACGA ACGACGGGTT GAGCTTGCAT TTGAAGAACA CCGTTTCTTT 
GATGTCAGGA GATGGAAAAT TGCTGCACAA ACAGAGAATA GACCGGTAAT GGCCATGAAG 
ATCACGAAAA ATACAAATGG AAGTTTTAGT TATCTGGTGG TTAAGGCGGA AGACAGGACA 
TTTAGCGAAC GTATGTATTT ATACCCTATT CCCGAAGTTG AGGTGCTTAA AAGTAACGGA 
AGTCTGGTCC AAAATCCGGG CTGGTAA

Protein sequence

MKLKRFMLGL MAILTTFMGC KDYLDREIPT NVKDDQVFVN YDRISQAGYG AYAFLFNTIG 
YNRINGAMLA SGCDEADHAD NISSIQRFNT GTWNATFNPE DVWGLFYQGI RRANLFLEES 
ADFKNLIYRD TINVTNKDLY KYRVRDLEWL RAENRFLRAY YYAELIKRYG GVPILLKSVT 
DIDELNTYKR KTYEECVQFI SDECDAVVPL LNESWVGFDG DKWRGRVTKG AAMALKARVL 
LYAASPLNNA SNDITKWQKA AKAAHDVIAL NKYGLHTDYR GLFRLGNGAD GNPEIIFAQQ 
GYNRNDYEKY NYPIGYDQGG LGSTSPSQNL VDAYEMKTTG LAITENGSGY DPANPYANRD 
PRLGLSILVS NTSFKGRPVE AWVGGLDGLG KFKATTTGYY IRKYVDENLN LAQGATSLHT 
WMIFRYAEVL LNYAEAMNEA YGPDVTAGYS MSAKKAVDMV RARTGIAMPP LPPGLSVDEM 
RLRIRNERRV ELAFEEHRFF DVRRWKIAAQ TENRPVMAMK ITKNTNGSFS YLVVKAEDRT 
FSERMYLYPI PEVEVLKSNG SLVQNPGW