Gene Francci3_3229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3229
Symbol
ID	3906196
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3823239
End bp	3824294
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	637880554
Product	Male sterility-like
Protein accession	YP_482315
Protein GI	86741915
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3320] Putative dehydrogenase domain of multifunctional non-ribosomal peptide synthetases and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.244566
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGC AAACCGCACG ACGGGTGCTT TTGACGGGGG CGTCGGGCGT GCTCGGTCAA 
GAGCTCCTGA GCCAGTTGAA AAGAGTTCCT GACATCGAGC CGGTGTGCCT GGTGCACCGC 
ACCGTCCTGG CCGACCAGAC GATTACCACC GTGCGCGGTG ACATCGCTCG TCCACAACTC 
GGCCTGGATG GATCGGAGTA CCGATCCCTG GTCGACAGCG TGGATGCGGT GGTGAATTCA 
GCCGCCGTGG TCGCATTCAA CGGTACCGAG AGGACATTAA GGTCGATCAA CGTCGAGGGA 
ACTTCGCGGA TAGCGCAGCT GGCCGCGGCG GCAGACGCAC CCCTCTACCA TGTGAGCACC 
GCCTACATTG GCGCCCGCAG CGACGGCGCC GGCGAGTCCG GTGCTCGCTA CGCCAGCAGC 
AAGCGCGAGG CCGAGGACGT AGTGCGCGGC GCGGGGGTCC CCTATGCCAT CCTCCGGCCC 
TCGATCATCG TCGGCCACTC CGATACCGGT GCCATAGCCA GCTTCCAAGG CTTCTACCAG 
ATGGTGGCCA GATTCCTGCA CGATAAACTA CCGATAATAC CCTTCTCCCC GGACTCTCGG 
ATCGATCTGG TGCCCGTTGA TTATGTAGCC GAGGCAGTTG TTGCCGCTGT ACGTAAGGAG 
GCGCTGGGCA GCGAACTCTG GCTCGCTAAT GGGCCGGCGG CACTGACCCT CACCGACGTC 
GTTGACATGG CGCTCGATAT TGGCCGTGAT TTTGGCTATC CGGCCAAGCC CCCGATGCTG 
ATATCCGGTA CTGTCCTGGA TGAATCCGCC ATCACGGATC CGGCACTATA CGCGGGGATA 
ATGAAGGCAG TAGCCTATTT CTCTGCATAC GTCCGCTCAA GCCTGATACT GCCGACATCG 
GCTGATGAGC TCGCCGCCCT CGGCGTCCGG CCGCTCCCCG ACGCCAGGAC GGTCGCGGAT 
CGGAGCATGC GCTACTGGGC GGCCCGCGAC GCTCGGTCGA ACCAGGGCAC GACAAAGATC 
GACCGAGCGG CCGTTGCTGG GAGCAGCCGG CCGTGA

Protein sequence

MTAQTARRVL LTGASGVLGQ ELLSQLKRVP DIEPVCLVHR TVLADQTITT VRGDIARPQL 
GLDGSEYRSL VDSVDAVVNS AAVVAFNGTE RTLRSINVEG TSRIAQLAAA ADAPLYHVST 
AYIGARSDGA GESGARYASS KREAEDVVRG AGVPYAILRP SIIVGHSDTG AIASFQGFYQ 
MVARFLHDKL PIIPFSPDSR IDLVPVDYVA EAVVAAVRKE ALGSELWLAN GPAALTLTDV 
VDMALDIGRD FGYPAKPPML ISGTVLDESA ITDPALYAGI MKAVAYFSAY VRSSLILPTS 
ADELAALGVR PLPDARTVAD RSMRYWAARD ARSNQGTTKI DRAAVAGSSR P