Gene Phep_1360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1360
Symbol
ID	8252460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	1618165
End bp	1619076
Gene Length	912 bp
Protein Length	303 aa
Translation table	11
GC content	43%
IMG OID	644935014
Product	Exopolysaccharide biosynthesis protein
Protein accession	YP_003091637
Protein GI	255531265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4632] Exopolysaccharide biosynthesis protein related to N-acetylglucosamine-1-phosphodiester alpha-N-acetylglucosaminidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.372504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.614697
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGATGT TCTTTTTTCT GGTATCTGTA GCTTGCAAAA AAGAGCAAAC CCAGCAAACC 
GATCTCCGAA TATTCAGTGC GCTTACAGAA AAGATCAAAC AAAATTCTGA TGTAATGGCC 
AATGTTTTTT CAGATACAAC TTTCCAGATC CAGCCCGGAG TCGAAGAAAC TGATATCCAT 
TACCAAAGCC AGAGCGGAGG TCTTAGCACA AAGATTTTTA TTTTAAAAAT TGACCTTAAA 
AACCCGGATG TCAAACTCCA GGCCGCTACG CCTTACGATG CACCAGGCTA TGGCTCACAA 
ACAGTACCTG AAATGGCCAA ATATGTAGAT GCGGCCAACA ACAGGGTTAT CGCAGGCATA 
AACGGAGATT TCTTCAACAC CAGCAGTTAT GTGCCTCTGG GTATCATTTA TAAAAAAGGG 
GTAGCAATTA AACCTGCCTT TACAGACAAT ACAGATAAGC CCCAGCAAGG TCTCAGTTTC 
CTCGGTATAC TGGCAAATGG CAAACCTTAT ATCGGCGATA AAGAAACCGA TTACCCCACA 
ATAAAGAGTC AGCTCAAAGA AGCCCTCGGC GCAGGGGTAT TTCTGGTTAA GGATTATAAA 
AAAATAACAC AGAGCATCCC AACCGTCGAT CCCCGCACCG GAGTTGGAAT AACAGACGAT 
GACCTGGTCT ATTTCATCGT CGTAGACGGT CGCAATTTTT ACAATTCCAA TGGCATCAAC 
TACCAGGAAA TGGGGAAAAT CATGTATGCA TTTGGTGTAA AGAATGCAGT AAACCTTGAT 
GGTGGCGGCT CTTCTACATT TATGATCAAA CATCCCCGGG TAGATGTGTG GCAAATCCGT 
AACAAACCTT CCGACGGTTC TCCGCGCGCA ATTGCAAATT CCTGGTTAAT CCTATCAAAA 
TCAAAACCTT AG

Protein sequence

MLMFFFLVSV ACKKEQTQQT DLRIFSALTE KIKQNSDVMA NVFSDTTFQI QPGVEETDIH 
YQSQSGGLST KIFILKIDLK NPDVKLQAAT PYDAPGYGSQ TVPEMAKYVD AANNRVIAGI 
NGDFFNTSSY VPLGIIYKKG VAIKPAFTDN TDKPQQGLSF LGILANGKPY IGDKETDYPT 
IKSQLKEALG AGVFLVKDYK KITQSIPTVD PRTGVGITDD DLVYFIVVDG RNFYNSNGIN 
YQEMGKIMYA FGVKNAVNLD GGGSSTFMIK HPRVDVWQIR NKPSDGSPRA IANSWLILSK 
SKP