Gene Phep_4061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4061
Symbol
ID	8255195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4903620
End bp	4904798
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	45%
IMG OID	644937725
Product	hypothetical protein
Protein accession	YP_003094314
Protein GI	255533942
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTGA AATGCCTTGT TAAAACTGCT TTAATCTCCT TCTTATTTGC AGTTTGCAAT 
GAGGGATTTG CGCAGGTTGT GGAGCCTGGT ACGCAGCCCA ATGGCAGCGA AATCAATAAC 
ATCATCACTG CTGTTCCTTT TTTGCTCATC ACACCAGATG CCCGTGCCGG AAGCATGGGC 
GATGCAGGCG TAGCGGTACA GCCTGATGCA AATGCCAGTG GCATCAACCC TTCCAAACTT 
GCTTTTTTAG ATAAAAAATA CGGCTTCTCT GTTTCGTACA GTCCCTGGTT AAAAAGCCTG 
GTCCCAGACA TCAGTCTGAC TTACCTGGCT GGTTTCTATA AGCCAGATGA ACGGACCACT 
ATTGGCAGCT CCCTGCGCTA TTTTAATCTC GGCGAGATCC AGCTGACGGA TATCAACCAG 
AACAATCTGG GTGTATATAC ACCTAATGAA CTGGCTTTTG ATGTGACTTA TGCCAGGCGC 
ATGGGCGAAT CTTTTTCATT GGGTACTTCC TTAAGGTATA TTTATTCGAA CCTTAGTTCG 
GGGCAGTTTT CGGCCGGTCA GCAAACGCAT GCTGCCTCTG GTATAGCAGT CGATGTATCC 
GCTTACTTTA AAAAACCTAC TGTATTTTTA GGAACAGATG CCATCCTTTC GGCCGGTCTT 
AACCTTTCAA ATATTGGCAC CAAGGTCAGT TATTCCGATA GCGGCCCCAA GTCTTTTTTG 
CCTGCAAACA TGAAAATAGG CGGGGCCTCC ACTTTTCTGA TCGATGATTA TAACCAGTTT 
ACTTTTGCCC TGGATTTTAA CAAGCTGATG GTACCTACAC AGCCGGTTTA TGATGCCAAC 
GGGAAGATCA TTTCGGGTAA AGACCCCGAC CGCTCCGTCC CTGCCGGTAT CTTTGGTTCA 
TTTGCTGATG CGCCGGGCGG TTTTAGTGAA GAGCTGAAAG AAATAAACAT TGCTGCCGGA 
ATGGAATACT GGTATAACCA GCAGTTTGCT TTAAGGGCCG GATATTTTTA TGAAAACCCG 
AAAAAAGGCA ACAGACGTTA CGCAACTCTT GGCGCTGGGT TAAAATATAA TGTGTTTAAT 
ATGGATATTG CCTATCTGCT TGCCAATGCA GATAAGAACC CATTGGCCAA TACCCTAAGG 
TTTACCTTAC TGTTTAACTT TGGCAGCACT CAAAATTAA

Protein sequence

MNLKCLVKTA LISFLFAVCN EGFAQVVEPG TQPNGSEINN IITAVPFLLI TPDARAGSMG 
DAGVAVQPDA NASGINPSKL AFLDKKYGFS VSYSPWLKSL VPDISLTYLA GFYKPDERTT 
IGSSLRYFNL GEIQLTDINQ NNLGVYTPNE LAFDVTYARR MGESFSLGTS LRYIYSNLSS 
GQFSAGQQTH AASGIAVDVS AYFKKPTVFL GTDAILSAGL NLSNIGTKVS YSDSGPKSFL 
PANMKIGGAS TFLIDDYNQF TFALDFNKLM VPTQPVYDAN GKIISGKDPD RSVPAGIFGS 
FADAPGGFSE ELKEINIAAG MEYWYNQQFA LRAGYFYENP KKGNRRYATL GAGLKYNVFN 
MDIAYLLANA DKNPLANTLR FTLLFNFGST QN