Gene Francci3_2831 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2831
Symbol
ID	3904743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3334237
End bp	3335460
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	74%
IMG OID	637880152
Product	homoserine O-acetyltransferase
Protein accession	YP_481918
Protein GI	86741518
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.630893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGGTT CCGTGCGGCC AAGAGCTGAG TCGCGTGGCA CCGGTGCGGC CCTTTCGGTC 
GAACCGGTAC CGCCGACGGT CCAACCGATA CCGCCGACGG TCCAACCGAT ACCGCCGACG 
CCACCGCCCG CCTCCGGGGC ATGGCGCGCC GGGATCGACC CGGTGGGACG GCGCCGGTTC 
GTCGACCTGC CGGGACCGCT GCAGCTGGAA CGCGGCGGCA TCCTGCCCGG CGTGACGGTG 
GCCTACGAGA CGTGGGGCCG CCTCGACGCC GCGGCCACCA ACGCGGTGCT GGTCCTGCAC 
GCGCTCACCG GGGACAGTCA CGCCGTCGGC CCGCCCGGGC CGGGCCATCC CACCCCAGGC 
TGGTGGGATG GCCTGATCGG GCCTGGGCGG GCCCTCGATA CCGATCGCCT CTTCGTGGTC 
TGTCCGAATG TGCTGGGCGG CTGTCAGGGC ACGACCGGGC CAGCCAGTCC CGCGCCGGAC 
GGCCGACCCT GGGGCGGCCG ATGGCCCGAG ATCACGATCT CCGATCAGGT CACGGTGGAG 
GTCGCCGTCG CCGACGCGCT CGGCATCCGG CGCTGGGCCG CGGTGGTCGG CGGCTCGATG 
GGGGGCATGC GGGCCCTGGA GTGGGCTGTC GGCCATCCCG ACCGGGTCGA CCACGCCGTG 
GTCCTGGCCT GCGGCGCGGC TGCGACGGCG GAGCAGATCG GGTTGTCCGC GGTGCAGCTT 
CGTGCGATCA TCGACGACCC GGCCTGGAAC GGCGGCGACT ACCACGGCCG GCCCGGCGGA 
CGCGGCCCGG ACGCCGGCAT GGGTCTGGCC CGGCGGGTGG CCCAGATCAG CTATCGCAGC 
GAGGCCGAAC TGGAGGAGCG GTTCGCGGAT CGGACCCGGC CCGACGGGTT GTTCGAGGTC 
GCCTCCTACC TCGACCACCA TGCCGGCAAG CTGGCCGCTC GGTTCGACGC CGGCACTTAC 
GTCGCACTGA CCCGGGCGAT GATGACCCAG GACGTCGGCC GGGGGCGCGG GGGGCGCGCG 
TCGGCGCTAC GGTCCTGCCC GGTGCCGTTC ACCGTCGCGG GGGTCGACTC CGACCGGCTC 
TATCCCCTCC ATCTGCAGGA GTACATCGCC GAGCGCGTCG GCGCGCCGTT GCGCGTCGTC 
CACTCGCGGC GCGGGCACGA CGGGTTTCTG ATCGAGACCG AGCAGGTCGC CGCAATCGTC 
CACGACGCCC TCCGGACGGC CTGA

Protein sequence

MPGSVRPRAE SRGTGAALSV EPVPPTVQPI PPTVQPIPPT PPPASGAWRA GIDPVGRRRF 
VDLPGPLQLE RGGILPGVTV AYETWGRLDA AATNAVLVLH ALTGDSHAVG PPGPGHPTPG 
WWDGLIGPGR ALDTDRLFVV CPNVLGGCQG TTGPASPAPD GRPWGGRWPE ITISDQVTVE 
VAVADALGIR RWAAVVGGSM GGMRALEWAV GHPDRVDHAV VLACGAAATA EQIGLSAVQL 
RAIIDDPAWN GGDYHGRPGG RGPDAGMGLA RRVAQISYRS EAELEERFAD RTRPDGLFEV 
ASYLDHHAGK LAARFDAGTY VALTRAMMTQ DVGRGRGGRA SALRSCPVPF TVAGVDSDRL 
YPLHLQEYIA ERVGAPLRVV HSRRGHDGFL IETEQVAAIV HDALRTA