Gene Phep_3904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3904
Symbol
ID	8255038
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4696999
End bp	4698210
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	40%
IMG OID	644937568
Product	hypothetical protein
Protein accession	YP_003094157
Protein GI	255533785
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGC CTTATTTTGA ACAATTCGGA TGGGAAGCTG AGATTGTAAC CGTTGATCCC 
AAATATTCAG ACCTGCAAAA AGACGATCTG TTAATGCAAG GTATTCCTGA AGGGTTACAA 
ATACATTATA TACAGGCATT TGATAAAAAA CTAACGTCCC CCTTTGGTTT AGGCAGCCTT 
GCGCTAAGGT CGCTATGGTT TTATTTTAGA GGGATCAACA AAATCCTTAA ATCCCAAAGG 
TTTGACCTTA TCTATTTTTC AACCACACAA TTCCCTGTTT GTATACTTGG GGCTTATTGG 
AAAAAACGGG TTAACATCCC TTATGTCATA GATATGCAGG ATCCATGGCA TTCTGACTAT 
TACCAGGATA AACCCAAAGC GCAACGGCCT GCCAAATACT GGTTCTCTTA CCGGCTCAAT 
AAATACCTGG AACCCATAGC AATGAAACAT GTAGGTGGAC TGATCAGCGT AGCTGATGAT 
TACATACAAA CATTAAAGAA CCGTTACCCA CAGATCAATA AAATTCCCTC ATCAGTAATC 
ACCTTTGGAG CATTTGAAAA AGATTTTGAA ATAGCTGAAA GTAATCAGCT CTCATTTAAA 
CCTCTTCTCC ACAGCAATAA AATCAATATA GTGTATGTAG GCCGCGGGGG TCTGGATATG 
CATACTGCCA TCAAACCGGT CTTTGAAGCA TTATATCGGG GCTTACAAAC GAAGCCTGAA 
GTATTTAAAA AACTACAATT TTCATTTATT GGCACCAGCT ATGCTCCGGC CGGACAAGGG 
AAAGCAACAG TTTTGCCGCT TGCAAGAAAA TACCAGGTCG AAGAGCAGGT AACAGAAATT 
ACAGAAAGAA TAAGTTTTTA TCATACATTA AACACACTTC AGCAGGCAGA TGCCTTATTT 
ATTCCGGGTT CTGACGACCC GCAGTATACT GCTTCTAAAA TCTATCCATA CCTGCTGGTA 
AAAAAGCCAC TCCTGGCTGT ATTTCATCGA AACAGCAGCG TGGTGGAAAT CGTAAATAAA 
TGCATAGTTA ATGCCCGGCT AATCCGGTTT CCGGATAAAA ACATGACTGA TGAACTCTAT 
TCTGTATTAA CAAATTGGGC AAACAACATT TTTACATCGC CGGAACTTAC AAAAGCCATA 
AAAGAATATA GTGCCGAAAA TATGACCAAA AAACAAACTG AATTGTTTAA CAAAGTTATT 
GGCGGGGATT GA

Protein sequence

MSLPYFEQFG WEAEIVTVDP KYSDLQKDDL LMQGIPEGLQ IHYIQAFDKK LTSPFGLGSL 
ALRSLWFYFR GINKILKSQR FDLIYFSTTQ FPVCILGAYW KKRVNIPYVI DMQDPWHSDY 
YQDKPKAQRP AKYWFSYRLN KYLEPIAMKH VGGLISVADD YIQTLKNRYP QINKIPSSVI 
TFGAFEKDFE IAESNQLSFK PLLHSNKINI VYVGRGGLDM HTAIKPVFEA LYRGLQTKPE 
VFKKLQFSFI GTSYAPAGQG KATVLPLARK YQVEEQVTEI TERISFYHTL NTLQQADALF 
IPGSDDPQYT ASKIYPYLLV KKPLLAVFHR NSSVVEIVNK CIVNARLIRF PDKNMTDELY 
SVLTNWANNI FTSPELTKAI KEYSAENMTK KQTELFNKVI GGD