Gene Phep_1921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1921
Symbol
ID	8253025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	2222603
End bp	2223733
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	37%
IMG OID	644935572
Product	hypothetical protein
Protein accession	YP_003092191
Protein GI	255531819
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.223609
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.136115
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATGA AATTAATATA TAAAACAAAC ATGATGAACA ACTTTAACTT TAAAAAACAG 
GCGCTGGTTA TACTATCGGC CTTCGTTTTG GTATTGGGCG CCTGTAAAAA GGATAAATTG 
CCGCCAATTG ACCCTCAGCC AAGTGCTACA ACCGGAGTGT ATGTGTTGTG TGAAACCGGT 
TATGGAAAAA TAGGAACAAT TACCTATTAT GAAGTAAATA CCGGCGCTGC TATACAGGAT 
TACTATAAAA AACAGAATGG CATTGATCTG GGTGTGAACA CAAGCGACCT GAAACAATAC 
GGCAGTAAAA TGTATGCCGT AGTTACCGGT ACGGATAAAG CCAGTAAGGA TTCATATATA 
GATGTAATGA GTATAGCGAC AGGTAAGTCG TTAAAAAGAA TTCCTTTTTC GGATGCGACT 
TCAGGCTTTT TACCACGTTA TATTGCGTTT TACAAGAACA AAGCTTATGT ATCTGGTTAC 
GACGGTTATG TTACCAGGAT AGATACAGCG GGTTTAACTG TTGAATCGAG ACTTCAGGTA 
GGCGGGGCGC TGGAGCAGCT GACAATTGTA AATGGTAAAC TGTATGTTAC AAACTCAGCC 
CATTTTATGT ATGCAACCAG CAATAACTCA TCAGTATCTG TTGTAGACCT GAATAACTTT 
AACAAGTTAA AAGACATTCC GGTAGGCTTT AATCCTACTA AAATTTCTGC AACAGGTTCG 
GGTGAACTGT TTGTGGTTAC AAGAGGTAAT TATGGTAATA TCTCACCATC ATTAGATAAA 
TTAAGTAGTG TTAGCGATAC TAAAACAGGA ACTGAAGCAT TAGATGTTGA GTATTTGAAT 
ATAACAGGTA ATAAAGGTTT TGTAATTGGT CCGTATGGTA ATGAATTTCT AAAAAATATA 
AATGTAAGTT CCGGCGTACT GGGTACTGAT TTTGTAACAG ATGCTACACC AGTTATTTTA 
CCTTATGCTG TTACGGTAAA CCCGTTAAGT AATGATATAT TTGTATCTGA TGCGAATGGT 
TATGCTTTAG TGGGTAAAAC ATTTTGCTTT GGTGCCGATG GTAAGAAGAA ATTTGAATTT 
GCCACCGGGG GATCGCCACA AAGTGCAGTA TTTAAATACA GCTATAAATA A

Protein sequence

MRMKLIYKTN MMNNFNFKKQ ALVILSAFVL VLGACKKDKL PPIDPQPSAT TGVYVLCETG 
YGKIGTITYY EVNTGAAIQD YYKKQNGIDL GVNTSDLKQY GSKMYAVVTG TDKASKDSYI 
DVMSIATGKS LKRIPFSDAT SGFLPRYIAF YKNKAYVSGY DGYVTRIDTA GLTVESRLQV 
GGALEQLTIV NGKLYVTNSA HFMYATSNNS SVSVVDLNNF NKLKDIPVGF NPTKISATGS 
GELFVVTRGN YGNISPSLDK LSSVSDTKTG TEALDVEYLN ITGNKGFVIG PYGNEFLKNI 
NVSSGVLGTD FVTDATPVIL PYAVTVNPLS NDIFVSDANG YALVGKTFCF GADGKKKFEF 
ATGGSPQSAV FKYSYK