Gene Franean1_3548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3548
Symbol
ID	5675716
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4207446
End bp	4208645
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	641242434
Product	GCN5-related N-acetyltransferase
Protein accession	YP_001507854
Protein GI	158315346
COG category	[R] General function prediction only
COG ID	[COG4552] Predicted acetyltransferase involved in intracellular survival and related acetyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATC TCGGCCAGCG CGTCGCGTCG CGGTCCGCGC CGCGGGTCGC GCCGTCCAGG 
CGCCTTGCGC GATCTAGCCG AGTCGTCGAC ATTCGGGACA TGAATCTGGT GGTCGACGTC 
GTGCTGGAGG CTGGTCTGCG CTACACGGAG ACGATCGAGT CGGGTGCGGG CGGCCGGTCC 
GTGCGTTACT GCCGGCTCGT GGCGGACCAG GACACGCCCG TCGGCGAGCT GGAGGTGCAT 
TCCTTCCGGT GGCGGTTCGG TGCCGTGGCC CTCGACGCCG AGGGTATCGG CGGGGTGGAG 
GTCCAACCGT CTTTCCGGCG CCGTGGACAC ATGGGCCGGC TTCTCCGCCA GGCGTTGGAC 
GGCATGTCAC GGCGGGTGAA CGTCGCCACG GTCTCCGACG GCATCCAGGG CGTGTACGAG 
AAGTTCGGCT TCGCCACGTG CGTTGCCGAG GGTCATCTGG ACGTTCGCGT TCGCGACGTC 
GAACGCGCCG CTGCCGCCGC TGTGCCGGAC GGTGCGCGCG TCCGACCCGG CTCGGCTGGA 
GACCTCCCAG CGATGGTGGA CCTCTACAAC GCCACGCACG CCCATCGTCC GTGGACCCAC 
GAACGTCCCG CGGACTGGAA CCGTCTGGTG CCCCAGACGA CATGGCGAGC GGGCTCGGAG 
ATCCTCGTCG TGGAGGCCGG GGGGACGCTC GCGGGATACG CGATCGTGGC GGGCCGGTCG 
TTCGGTGACG GCTACTTCGG GCTGGCTGTC GAGGAGATGG CGGCCCGCGA CGCCGGCGTT 
GCCCTGTGCC TGCTCGCCGA CGTTGCCAGG TCCGCATGGG AGTTGCGGGT CAGCGAGTTT 
CGGGTGCGGG AGCCGTTGGA CGGCGTCGTC GGGCGGCTCG CGCGTCACCT GGGCTGCGCC 
TACCACCAGG AGTTCCCGCC GACCGGCGGG ATGATGGCGG CGATCCTGAA CCGATCCGAG 
CTGCTGGCCA CGCTCGAGCC GGAACTTCGG CGCCGGGACC GCGGTGCCGG CGCCGTCGAC 
GAACATGCGC GGCCTGGTTT CCAGGCGGCG CCACAGCGGA GCTCCTGGCG CCCTACGCGC 
ACGCGCTGGA CCGGTACTGA ATCGCCATCG GGCGCCGCAC GCGCCTGGCC AACTACAACG 
ACGGTCATCG CTCCGACCAC ATCGGGCGCC AGGGCTTCGG CCCCGGGGCG GGCGCGGTAG

Protein sequence

MTDLGQRVAS RSAPRVAPSR RLARSSRVVD IRDMNLVVDV VLEAGLRYTE TIESGAGGRS 
VRYCRLVADQ DTPVGELEVH SFRWRFGAVA LDAEGIGGVE VQPSFRRRGH MGRLLRQALD 
GMSRRVNVAT VSDGIQGVYE KFGFATCVAE GHLDVRVRDV ERAAAAAVPD GARVRPGSAG 
DLPAMVDLYN ATHAHRPWTH ERPADWNRLV PQTTWRAGSE ILVVEAGGTL AGYAIVAGRS 
FGDGYFGLAV EEMAARDAGV ALCLLADVAR SAWELRVSEF RVREPLDGVV GRLARHLGCA 
YHQEFPPTGG MMAAILNRSE LLATLEPELR RRDRGAGAVD EHARPGFQAA PQRSSWRPTR 
TRWTGTESPS GAARAWPTTT TVIAPTTSGA RASAPGRAR