Gene Phep_4230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_4230
Symbol
ID	8255366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	5107215
End bp	5108405
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	42%
IMG OID	644937896
Product	hypothetical protein
Protein accession	YP_003094483
Protein GI	255534111
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000155249
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCTT ATATTTTAGC TATTGGGCTG ATGATGGCAA TAAATTTTGC CATTGCGGGC 
ACCAAAGATC CGAATGATCC TGTTCGTTCG AAAACCTTTT CAAAAAGTTT TCCATTAGAT 
GGGAATGATA AGGTAAACCT GAACAACAGG TACGGGGAGA TGCTGATCAA AACCTGGGAT 
AAAAAAGAAA TACGGGTAGA CATTGACATT AAAGCTTACA GCAAGGACGA GGCTGATGCG 
CAGCGTTTGG TAGATGGAAC AGTTATAACT GCAGATAAAA GCGGCGACCA GGTTTCATTT 
AAAACCAATT TTGCAACAGA GGGTGGTAAA TCAGGTGCCA GTTTCAGGAA CGGAAAAACG 
ATATCCAGAA GGGAAATCAG GGTAAATTAC GTCGTATATA TGCCTGCGAC CAACGCTTTA 
ACCTTAAGTA ATCAATATGG AAATGTAAAT ATAGGCAGTT TTTCCGGCGC ATTGATCGCT 
AAGGTTCAAT ATGGGAGTTT AACGGTGGGA AATCTGAAAA ACGCCAGCAA TATCCTGGAA 
ATTCAATATG GCTTTACTAA AATTCAGGAA ATAAATGCAG CTACGATTAA ACAGCAATAC 
GGGGCGGGGC TTAACATTGG TACCATTGGC AGCTTGAATC TGGAGGCACA GTATGCGGGC 
GTAACCATTG GCACCATTAA ATGGGATGCT GTGGTTAAAC AGCAATACGG ACCGGGACTG 
GACATTGGCA GGGTAAGTAA CCTGGACCTG AATGTACAAT ATGCCAATGT AAAACTGGGA 
ACGGTTATCG GGGATGCGAA TATCAAACAG CAATACAACA AACTCTCGAT CGGGTCTGTA 
AACACATTAA ACCTAAAGAG CCAGTACACA ACAGTTGCCA TTGGGAATTT AAATGGCCCG 
GGTAATTTTG GTGTTGCCTA TGGCAAACTG ACTGTCGAGC AAATAGGCTC AGGGTGTAAA 
AATTTAAACC TGTTGAGCAG TTATTCACAT ACTTCCTTAA AGTTCAGCGA CAATTACCAG 
GGGAACTTTG AATTAAGGAC CAGCTATTCG CCATTCAAAG CAGGTGCAGG AGTAAGCTCG 
AAACTGGTAG CCGAAAAAGG GAACATTAAA AATTATGCAG GTACCATAGG AAACGGTGGC 
GGAGCCCAAA TTATGCTCAA GGCCGATTAT GGTTCGTTGA ATTTAAACTA G

Protein sequence

MKSYILAIGL MMAINFAIAG TKDPNDPVRS KTFSKSFPLD GNDKVNLNNR YGEMLIKTWD 
KKEIRVDIDI KAYSKDEADA QRLVDGTVIT ADKSGDQVSF KTNFATEGGK SGASFRNGKT 
ISRREIRVNY VVYMPATNAL TLSNQYGNVN IGSFSGALIA KVQYGSLTVG NLKNASNILE 
IQYGFTKIQE INAATIKQQY GAGLNIGTIG SLNLEAQYAG VTIGTIKWDA VVKQQYGPGL 
DIGRVSNLDL NVQYANVKLG TVIGDANIKQ QYNKLSIGSV NTLNLKSQYT TVAIGNLNGP 
GNFGVAYGKL TVEQIGSGCK NLNLLSSYSH TSLKFSDNYQ GNFELRTSYS PFKAGAGVSS 
KLVAEKGNIK NYAGTIGNGG GAQIMLKADY GSLNLN