Gene Phep_1301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1301
Symbol
ID	8252401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	1548589
End bp	1550304
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	49%
IMG OID	644934955
Product	RagB/SusD domain protein
Protein accession	YP_003091578
Protein GI	255531206
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0026313
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAGA AAATATTTTT AGCTGCAATC TTTATGGTTC TAATGGCTGC AGCCTGTAAA 
AAAGGAGGGG TGCTGGAGCA GGTTAAAACC ACAGATTTAA CAGAAGAAAG TACCTTTGCA 
GACAGTGCCC GCACTATGCA GTTCCTAACC AGGATTTATA CTGATATTGG CTTTAGTTCC 
GATCCTAAAA GGTTTGGCAG CAGTGTAGGG GTATACAGCA TTTGTGATGA GGTGGAAGGC 
TCGTTGCTCA GTGCTACTGC ATTTAACGTC ATTTTCCAGA CTGGAGCAAT CAGTGCATTA 
AATGTGCCTA CTGATGCCTG GGTAACTACA TACGCCAACA TTAGAAGGGT AAACTTATTG 
CTGAGCCATT TGCAGACCAC ACCGCTATCT CAGCGTTTAA GGGACAGGAT TGCCGGTGAG 
GCCCGCTTTT TAAGGGCCTG GTATTATTTT ATCCTGATTA AACATTACGG GGGCGTGCCG 
CTGGTAGGCG ATGTGGTTTA TGGCGCCACT GACCCGGTTT CAGGCAAGCG TGCCACTTAT 
GAAGAATGTG TGAATTATAT TGAATCGGAA TGCGATGCTG CTGCCCTGGC CCTTCCACTC 
GTACAAACCG GGCTCGATTT TGGACGCATT ACCAAAGGTG CAGCATTGGC ACTAAAATCC 
AGGTTGCTGT TGTATGCTGC AAGCCCGCTG TTTAACGGCC GGGTAGATAT GGATGGGGTA 
TTGGGTTATC CGAATGCCGA TCCTGCCCGA TGGAGCAAGG CTGCAAAAGC AGCGCTGGAT 
GTGATCAGCC TGAACCAGTA CAGTCTTTAT GAGCTGGCTG GCGGTCTGGG CTTTCAGAAA 
GTATTTACCC TGCGCAAAAA CAGTGAATAC ATACTGGCTT CCATGGCTGG TAATAACCGT 
ACGCTGGAAG CCATCTGGGA TCCGGCGACC AGGACAGGGT CGGGCAGTGC CATGCCCTAC 
CAGGAACTGG TAGATGCTTT TGGTACCATC AATGGCAAAG CGATTACGGA GGACCTTAAA 
TCGCCTGGAA ACCCTACAGG TTATGATCCC ACAAATCCTT ATGTAAACCG CGATCCCCGT 
TTCAACTGGA GCATCCTGTA CAATGAAGCC CCACGGTTGA ACACCAGTAA AACCGTTACA 
CCGGTATTTA CTTACGCAGG TGCTGCGCAG GACGGTTTTA ACTTTACCAA AACCGGCTAT 
TATTTAAGAA AAATGCTGGA CGACAATACC ATTGCCAGTA GCACCTCATC GGCAACAGAA 
CGCTGCTTTC CTTTAATCCG CTATGCCGAG ATCCTGTTAA ATTATGCCGA AGCCAGTAAT 
GAGGCAGGTG ATACACAAAC CGCATACACA CAGCTCAAGG CCATTCGCAA GCGCGCAGGC 
ATACTGGCTG GTCCGGAAGA CGATTATGGA CTGGCGGAGG GGCTTACTAA AGAAGGGATG 
CGGACGGTGA TCCAGAATGA AAGAAGGGTA GAGCTGGCTA TTGAAGAGCA TCGCTACTGG 
GATGTACGCA GATGGAAGAT TGCAGAAAAT GTATCCAATA AAACCCTGCA CGGGATGAAA 
ATCACCAGGC TAGGTACCGG TACACCTGCA ACCTATACTT ACGAACTGAT CAATATCCGT 
ACACCGGCCT TTGTTGCACC GAAATATTAC CTGTGGCCAA TCCCGCAGGG CGAGGTCAAT 
AAATCAGCAG AGCTGATACA AAACCCGGGC TGGTAA

Protein sequence

MKKKIFLAAI FMVLMAAACK KGGVLEQVKT TDLTEESTFA DSARTMQFLT RIYTDIGFSS 
DPKRFGSSVG VYSICDEVEG SLLSATAFNV IFQTGAISAL NVPTDAWVTT YANIRRVNLL 
LSHLQTTPLS QRLRDRIAGE ARFLRAWYYF ILIKHYGGVP LVGDVVYGAT DPVSGKRATY 
EECVNYIESE CDAAALALPL VQTGLDFGRI TKGAALALKS RLLLYAASPL FNGRVDMDGV 
LGYPNADPAR WSKAAKAALD VISLNQYSLY ELAGGLGFQK VFTLRKNSEY ILASMAGNNR 
TLEAIWDPAT RTGSGSAMPY QELVDAFGTI NGKAITEDLK SPGNPTGYDP TNPYVNRDPR 
FNWSILYNEA PRLNTSKTVT PVFTYAGAAQ DGFNFTKTGY YLRKMLDDNT IASSTSSATE 
RCFPLIRYAE ILLNYAEASN EAGDTQTAYT QLKAIRKRAG ILAGPEDDYG LAEGLTKEGM 
RTVIQNERRV ELAIEEHRYW DVRRWKIAEN VSNKTLHGMK ITRLGTGTPA TYTYELINIR 
TPAFVAPKYY LWPIPQGEVN KSAELIQNPG W