Gene Francci3_1561 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1561
Symbol
ID	3904793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1872352
End bp	1873689
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	71%
IMG OID	637878898
Product	4-hydroxybutyrate coenzyme A transferase
Protein accession	YP_480666
Protein GI	86740266
COG category	[C] Energy production and conversion
COG ID	[COG0427] Acetyl-CoA hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.788962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATCG TCAGCGAGGC GGAGTTCGGT CGCCGCATCG AGACCCATCT CGCCGCGGGT 
TCCGGTGTGG GCGGTGGAGC CGGTCCTCGT GGAGCCGGAG CCGGTACGGG GGTAGCCGGT 
CCTGGCCGAT GGCGGTCGGC CACGCCGCGG GTCGTGGCGG CGGGGAACTT CGCCACCCCG 
CTCGTCGCGT TGCGTGTGAT CGACGCGGTG GTGAGTGAAT ACCGCCTCTT TATGATCAAC 
GCTCAGGGTG GCGTGCCGGA ACGCGGCGGC GTGACGCCGG AGACCGCGTT CGTCGGCCCG 
GCGATGCGCA ACGTGCCCGG CCTCGACTAC CTGCCCAACC GGCTCAGCCT CGTGCCTCGC 
CTGCTCGCGA CCACCCACCG GCCCGACGTC GTCGTGTTGC ACACCAGCGT GCCCGACGGG 
GGGAAGGTCT CGCTCGGCAC CGAAGTCAAC ATCCTGCCGG CCGCGGTCGA GGCGGCCCGC 
GCGCACGGGG GACTGGTGGT CGCCCAGCTC AACCCGGCGA TGCCCTACAC CTTCGGCGAC 
GGTGAACTGA GCATCGATGA CGTCGACCTC GCCGTGGAGG TGGAGCAGCC GCTCGCCAGC 
CCCGCGGTCA CGCCCGTCGA CGACGTCCGC GGGCAGATCG GCGAGCGGGT CGCCGCGCTC 
GTCGAGGACG GGGCGACCCT GCAGCTCGGC ATCGGCGGTG TCCCGAACGC CACGCTGTCG 
GCCCTCGTCG ACCGGCGGGA TCTGCGCGTG TGGACCGAGA CCTTCTCCGA TGGCATGCTC 
GCGCTCGAAG CCTCCGGCGC GCTGGCCGCC GGGACACCGC TGCGGACCTC GTTCCTGTTC 
GGGTCGGCCG AGCTCTACTC GTGGGCGCAC CGCAATCCGC GGCTGCTGCT GGTGCGCACC 
GAAATCGTGA ACGACCCGGG GGTCATCGCC CGGCAGCCGC GGATGACCTC GATCAACACC 
GCGCTGCAGG TGGATCTGTA TGCGCAGGCG AACGCGTCCT GGATCCGCAA CCGCATCTAC 
TCCGGCTTCG GTGGGCAGTC CGACTTCGTC GTCGGCGCGC TGCACGCGGC CGACGGCAAG 
GCGATCATCG CCCTGCCGAG CCGGCATGCC CGGTCGGGGG ATTCCTGTGT GCTGCCGCGG 
CTCACCAGCC CGGTCACCAG TTTCCAGCAC AGCTACGTCG TGTCCGAGAA CGGGACCGCG 
GCCGTGTGGG GGCGCGGCCA GCACGAACAG ACCGCCCGAC TCATCGACCA CGTCGCCCAC 
CCCGACGCCC GAGCCGGCCT GACGGAGGCG GCCGGGTCGC TGGGACTGCT CGCCGGCCGC 
GCATCGTCAA CCGTCTGA

Protein sequence

MDIVSEAEFG RRIETHLAAG SGVGGGAGPR GAGAGTGVAG PGRWRSATPR VVAAGNFATP 
LVALRVIDAV VSEYRLFMIN AQGGVPERGG VTPETAFVGP AMRNVPGLDY LPNRLSLVPR 
LLATTHRPDV VVLHTSVPDG GKVSLGTEVN ILPAAVEAAR AHGGLVVAQL NPAMPYTFGD 
GELSIDDVDL AVEVEQPLAS PAVTPVDDVR GQIGERVAAL VEDGATLQLG IGGVPNATLS 
ALVDRRDLRV WTETFSDGML ALEASGALAA GTPLRTSFLF GSAELYSWAH RNPRLLLVRT 
EIVNDPGVIA RQPRMTSINT ALQVDLYAQA NASWIRNRIY SGFGGQSDFV VGALHAADGK 
AIIALPSRHA RSGDSCVLPR LTSPVTSFQH SYVVSENGTA AVWGRGQHEQ TARLIDHVAH 
PDARAGLTEA AGSLGLLAGR ASSTV