Gene Francci3_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1996
Symbol
ID	3903704
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2345473
End bp	2346513
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	73%
IMG OID	637879332
Product	transcriptional regulator
Protein accession	YP_481099
Protein GI	86740699
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.299253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCAGCG GAATAGGCTG TTCTGCCGTG CTGCATAAGG AAACGGCCAC TCGCCACGCC 
GTGGTGGCCC TCGCGGTCCC GGCCACCGTC GCGATGGACC TCGCGATCCC GGCCCAGGTG 
TTCGGCCACC TGGACCTGGC CGAGCATTAC ACGTTCACGC TGTGCACGGA GCAGCCTGGC 
TCGCTGCCCA CCACCACCGG CTTCGCCTTG GAGGTGGCGC ACGGGCTCGC CGCGCTGGAT 
GCCGCTGACA CCGTCGTCGT CCCCGGGTAC GCCCCACTGG TCACACCCGC ACCAGGGGTG 
CTCGACGCGC TGCGCGCGGC TGCCGACCGC GGCGTCAGAC TGATGTCGGT GTGCACCGGA 
GCGTTCGCCC TCGCTGCCGC CGGGCTACTC GACGGTCAGC GGGCCACCAC CCACTGGGAG 
GACGCGGGCG ACCTCGCCGC CCGCCATCCG ACGGTGCAGG TGGACCCGAA CGTTCTCTAC 
GTCGACGGGG AGCGGATCCT CACCAGCGCC GGAGTGTGCG CGGGGATCGA CCTGTGTCTG 
CACATACTGC GGCGCGACCT CGGCAGTGCC GTCGCCACCC GCGTCGCCCG CCGGCTGGTG 
GTGGCGCCCC ATCGCGCAGG CGGCCAAGCC CAGCTGTTAC GCCGCCCGGT GCCCGGTCCA 
AAGCCCGGCT CTGGCGGTCC TGGCAGGCTG GCCGCGACCT GCGACTGGGC GCTGGAACGG 
CTCGCCGAGC CACTGTCCGT CGCTGATCTC GCCGGCCACG CTGGCTACGC GACGCGCACG 
TTCGCCCGGC GCTTCATCGC CGAGTACGGC GTCACGCCCA GGCAGTGGCT GCTCGCCCAC 
CGGATCGCCG AGGCGCGGCT GCTGCTCGAG GTGACCGACC TGCCGGTGGA TCGGATCGCC 
GCCCGTTGCG GACTGGGGAC CGCCGCCAAC CTGCGGATCC ACCTCGCCCG CGACGCCGCC 
AACACGCCGT CCGCCTACCG CGCCTCCTAC CAGGGCCGCC CGCGCCGAGC GAGTGGGCGT 
GCCGACGAAC TCGCCCCGTA A

Protein sequence

MRSGIGCSAV LHKETATRHA VVALAVPATV AMDLAIPAQV FGHLDLAEHY TFTLCTEQPG 
SLPTTTGFAL EVAHGLAALD AADTVVVPGY APLVTPAPGV LDALRAAADR GVRLMSVCTG 
AFALAAAGLL DGQRATTHWE DAGDLAARHP TVQVDPNVLY VDGERILTSA GVCAGIDLCL 
HILRRDLGSA VATRVARRLV VAPHRAGGQA QLLRRPVPGP KPGSGGPGRL AATCDWALER 
LAEPLSVADL AGHAGYATRT FARRFIAEYG VTPRQWLLAH RIAEARLLLE VTDLPVDRIA 
ARCGLGTAAN LRIHLARDAA NTPSAYRASY QGRPRRASGR ADELAP