Gene Phep_1874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1874
Symbol
ID	8252978
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2166379
End bp	2167437
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	43%
IMG OID	644935525
Product	homoserine O-acetyltransferase
Protein accession	YP_003092144
Protein GI	255531772
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000788104
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACAA TCTCCATATA TAATTACAAC AAAACCTTTA AACTTGAAAA TGGCAAAAAG 
TTGCGTAAGC TTGAAATTGC CTATCAGACT TATGGTAAAT TAAATGCCAA AAAGGACAAT 
GTAATTTGGG CCTGTCATGC ACTTACAGCG AATTCTGATG TGCTGGATTG GTGGAAAGGG 
CTTTTTGGCA ACAATGCGCT GTTTAATCCT GATGAACACT TTATCATATG TGCCAATGTA 
TTGGGCTCGC ATTATGGCAG CACCAACCCA TTGAGTACCA ATCCGGTAAC TGGTCAGCCT 
TATTACCTGG CCTTTCCGGA GTTTACCATC AGGGACCTGG TTGCAGCACA CCGGCTGCTT 
GCAGCACATC TGGGGATCAG TACGGTTAAG GTATTGATTG GCGGTTCATT AGGGGGACAA 
CAGGCATTGG AATGGGCCAT CACTGATAAC AATGCCATAG AGAACCTTAT TTTAGTGGCC 
ACCAATGCCG TACACTCGCC ATGGGGCATA GCCTTTAATG AGAGCCAGCG GCTGTCCATT 
ACAACGGACC GTAGTTTTTA TGCACAAAAA CCTGATGGCG GGTTAAAAGG ATTAAAAGTT 
GCCAGAAGCA TTGCTTTATT GTCCTACAGG ACCTATGATG CCTATTCGGC TACCCAGCTG 
GAAAGTGTGA ACGATAAAAT CGGTAGCTTC AGGGCTTCTT CCTATCAGAA TTACCAGGGA 
GAAAAACTCT GTAAGCGTTT CAATGCTTAC AGCTACTGGT ACCTGAGCAA AGCGATGGAC 
AGTCATAATG TAAGCAGGAA CAGAAATAGT GTAATTGACG CCCTGGCATT GGTAAAAGCA 
AATACCCTGG TAATAGGTAT TGAAAACGAC ATTCTTTTCC CATTGGCAGA ACAGGAGTTC 
ATGGCAGAAA ACATCCCTGG TGCAGAATTC CAAAGTCTGA AGTCGGCCTA CGGCCATGAC 
GGTTTCCTGA TTGAAACAGA TGCGCTTACA AACGTTATTG GTAATTTCCT TAAAGAGAGC 
GTACACAAGA AAATAATTAA ATTACATAAA ACAGCATAA

Protein sequence

MSTISIYNYN KTFKLENGKK LRKLEIAYQT YGKLNAKKDN VIWACHALTA NSDVLDWWKG 
LFGNNALFNP DEHFIICANV LGSHYGSTNP LSTNPVTGQP YYLAFPEFTI RDLVAAHRLL 
AAHLGISTVK VLIGGSLGGQ QALEWAITDN NAIENLILVA TNAVHSPWGI AFNESQRLSI 
TTDRSFYAQK PDGGLKGLKV ARSIALLSYR TYDAYSATQL ESVNDKIGSF RASSYQNYQG 
EKLCKRFNAY SYWYLSKAMD SHNVSRNRNS VIDALALVKA NTLVIGIEND ILFPLAEQEF 
MAENIPGAEF QSLKSAYGHD GFLIETDALT NVIGNFLKES VHKKIIKLHK TA