Gene Phep_3893 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3893
Symbol
ID	8255027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4685133
End bp	4686257
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	44%
IMG OID	644937557
Product	glycosyl transferase group 1
Protein accession	YP_003094146
Protein GI	255533774
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAAAA AAATTCTGCT GCTCACACTG GAAACATTTT GTGCCACGGG CGGTATACAG 
AAAATGGGCC GGATACTGGC TTACGGCTTA CAGCAGTTGG GTGCAAAACA TAAATGGGAG 
GCTGAGCTGT ATTCCTTATG CGACCGGAAA ACCGACTTAA TGCCCGAATA TTTAGCGGAA 
GAAAAGTTTA AAGCTTTTCG CAAAAACAGG CTGAAATTTA TGTGGGAGAG CATAAAGGCA 
GGAAAGAAGG CAGACCTGGT TATACTAAGC CACATCAATT TATCGGTACT CGGCTGGGCA 
ATATACCTGC TTAATCCAAA TTGCCAGATC TGGCTTATTG CACATGGAAT AGAGGTTTGG 
CGCCCCTTAA GGTTATGGAA AAAGTCGGTT TGGAAAATTT GCAGTAAGGT AATCTGTGTA 
AGCAGGTATA CACAGGAGAA AGTTATTGCC TTACACCAGG TTGCACCCGA ACAGTGTACA 
GTGGTCAACA ACGCAGTCGA CCCCTTTATC ACCTTTCCTG AACATTTCCA TAAACCCGGG 
TATTTACTGG AACGGTACGA ATTAAATACA GATCAGAAAA TTGTATTTAC GCTGGCCCGC 
ATTTCCGTTA CAGAACAGTA TAAAGGTTAT GATCAGGTGA TAAAAGCCCT TGGCAATCTC 
GGTCAGAACA ATATACAGTA TGTGCTTGCA GGACCTTATG ATGAAGCTGA AAAGCTACGC 
CTTACACAAT TGGCAAGCCA GTACGGCCTG GGCAATAATT TTATACTTCC AGGTTATATC 
AAAGCTGAAG AACTGGCCGA TCATTTTTTA CTGGCTGACC TGTTTGTATT GCCCAGCAAG 
AAAGAAGGCT TTGGGATTGT GTTTATAGAA GCTATGGCCT TCGGCTTACC CATCATCTGC 
GGCAATGCTG ATGGCAGTGT GGATGCAGTG AAAAACCAGG AGATGGGTAC AGCCATTGAT 
CCGGATGATA TCGGGGCCCT GGAACAGGCC ATCCTCCGGA ACCTTGGCCG CACCTTAAGC 
ATTGGGGCAC GCAAAAGCAT TCAGCAACAA TGTTTAAAAT ATTTTAGTCA GCAGCATTAC 
CTGCAAACCT TAGAACGGTT AATCAAAAAT GAAGCCTGTA ACTGA

Protein sequence

MSKKILLLTL ETFCATGGIQ KMGRILAYGL QQLGAKHKWE AELYSLCDRK TDLMPEYLAE 
EKFKAFRKNR LKFMWESIKA GKKADLVILS HINLSVLGWA IYLLNPNCQI WLIAHGIEVW 
RPLRLWKKSV WKICSKVICV SRYTQEKVIA LHQVAPEQCT VVNNAVDPFI TFPEHFHKPG 
YLLERYELNT DQKIVFTLAR ISVTEQYKGY DQVIKALGNL GQNNIQYVLA GPYDEAEKLR 
LTQLASQYGL GNNFILPGYI KAEELADHFL LADLFVLPSK KEGFGIVFIE AMAFGLPIIC 
GNADGSVDAV KNQEMGTAID PDDIGALEQA ILRNLGRTLS IGARKSIQQQ CLKYFSQQHY 
LQTLERLIKN EACN