Gene Phep_3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3902
Symbol
ID	8255036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4694681
End bp	4695709
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	41%
IMG OID	644937566
Product	glycosyl transferase group 1
Protein accession	YP_003094155
Protein GI	255533783
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.661278
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATTG CCATCCTGGT TAATCCACTG ATTCCCGTAC CACCCGAACA ATATGGGGGC 
ATTGAACGGA TCGTTTACCT GCTGATCAAA GAACTCCAGA GAAATGGCCA TGAGGTTATA 
CTATATGCGC ACAAAAACTC ACAGGCCGGT TGTAAGTTAA TCGCCTATCA GGAATCCGTA 
AATTATGGTG CAAAAGATTT TATAAAGATT AATGCCTTAA CTGCAAAAAT TGCTTTTCAG 
GATTTTGATG TGTTGCACAC CTTTGGACGT ATGAACAATA TCGCTTTGAT GATGTGGAGC 
AAGATACCAA AGGTGGTATC CTATCAATTG CCCCCTACTA TTTCACAGGT AAAAAAAGCC 
ACAAAAATAG CCTTCAAAAA TACTTTGTAT TTTACTGCCT GCAGTAATTT CATAGCCAGG 
CAGATCAATA AATTTGCAAA TGTTACTACC ATTTACAATG GGGTAAACAT CAACGAATAT 
CAGTTTAACG CAACAGTATC CGCTGATGCC CCACTTGTAT TTTTAGGAAG GATACAGGAA 
GAAAAAGGTA CATCCATTGC CATACAGGTA GCAAGGACAA CAGGCCGGAA ACTAATTATT 
GCCGGTAATA TCCCTGCAGA AGAAACCCAC AAGCAATATT TTAGCACCAA AGTAAAACCA 
TTTATAGACG ATGTGCAGAT CAGCTATATT GGCCCGGTAA ACAATTTTCA AAAAAACGAG 
TTACTTGGAA ACAGTTATGC TCTGTTAATG CCGGTAACCT GGGACGAACC TTTTGGTATT 
GTAATGGCCG AAGCTTTGGC TTGCGGGACA CCGGTAATTG GTTTTAACAG GGGCGCTATA 
CCCGAAGTGG TCATTAATGG ATTAAATGGT TTTGTATGCA ATACCCTTAC CGAAATGATT 
GCCGCGGTTG GCCACATCCC AGAGGTCAGC AGGCTTACAT GTCGTGGTAC TGCTGAAGAC 
AGGTTTAATG CCGTTGTGCT GGGCAAACAA TATGAAAACC TTTACAGAAA GGCGATAAAC 
AGGCGTTGA

Protein sequence

MKIAILVNPL IPVPPEQYGG IERIVYLLIK ELQRNGHEVI LYAHKNSQAG CKLIAYQESV 
NYGAKDFIKI NALTAKIAFQ DFDVLHTFGR MNNIALMMWS KIPKVVSYQL PPTISQVKKA 
TKIAFKNTLY FTACSNFIAR QINKFANVTT IYNGVNINEY QFNATVSADA PLVFLGRIQE 
EKGTSIAIQV ARTTGRKLII AGNIPAEETH KQYFSTKVKP FIDDVQISYI GPVNNFQKNE 
LLGNSYALLM PVTWDEPFGI VMAEALACGT PVIGFNRGAI PEVVINGLNG FVCNTLTEMI 
AAVGHIPEVS RLTCRGTAED RFNAVVLGKQ YENLYRKAIN RR