Gene Francci3_3496 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3496
Symbol
ID	3905230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4167916
End bp	4169376
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	72%
IMG OID	637880818
Product	cell envelope-related transcriptional attenuator
Protein accession	YP_482578
Protein GI	86742178
COG category	[K] Transcription
COG ID	[COG1316] Transcriptional regulator
TIGRFAM ID	[TIGR00350] cell envelope-related function transcriptional attenuator common domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.625789
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.409021
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTGGC CTCCGGATCG TCCGGATCGT CCGGAACGGT ACGGGCCGAC GGCGGGACGC 
CGGGACGGCG AGCGGCCTGG CCGGTCCGTC CGTGACCCGC GGGACCCACG CCGGGCCCCT 
GAGGAGGACT GGCCCGTCGG GCAGTGGCCG CGCCGGGAGC ACCGGCCCGC TCCGCGGGGT 
CACGATGATG ACGAGCCGCG CGTACCCCCC GGCGCCTACC CCGATCCCTA CGGCCGGTAC 
CCCATCGATC ACCCGGCGGC CGAGCCCCGG TATGACCGGC CGGCCCCGGA GGGTCCCGTG 
GCACCCGGGC AGGGCGGCTT ACGGCGCGGT CTCACCGCCA TGGCCGCGGT GTTGGCGACC 
CTCGTCCTGA TCCTGGCGAC CGGTGGCTGG GCCGTGCTGA AGCACTACGA CGGTAGGGTG 
CATCACATCC CGCTGGCCTT CTCCGCCAGC GCGGACCGGC CGGCGTCCGC ATCGGGCGGA 
ACGCAGAACA TCCTGCTCGT GGGGTCGGAC ACTCGGACGG GGACCAACGG CGAGTTCGGC 
CAGGTCGAGG GGCAGCGGTC GGACACGACC ATCCTCGCCC ACCTCGACGG CGACGGTTCG 
ACGACTCTCA TCTCCTTCCC CCGGGATCTG TGGGTGCGGA TTCCCGCGTA CACCGACGCG 
GCGGGCACGC AGCACGCGGC GCAGCGGTCC AAGCTGAACG CCGCCTTCTC CTACGGCGGG 
CCGTCCCTGC TCGTGGCCAC GATCGAGAAC CTCACCGGGA TCCGGGTCGA CCACTACGTT 
CAGATCGACT TCATCGGCTT CCAGGGGATG ACGGACGCCC TCGGCGGGGT CACCGTCTGC 
ATCAAGGAGC TTCCCCCCGA GCTGAAGGCA CGGGGTTTCG ACAACCTGCA CGACCATTAC 
TCCGGGTTTT CCGGTCAGGT CGGCGAGAAC ACGCTGAACG GGGCGCAGGC CCTCTCCTTC 
GTCCGGCAGC GGTATGGCCT ACCCGAGAGC GACATCGACC GCATCCGCCG CCAGCAGCAG 
TTCCTCGGTG CCGTCTTCCA GCGGATCGCG TCGACGGACA CCCTGCTCAA CCCGGCGAAG 
CTGCTCGGGG TGGTCGACTC CGCCACCTCG GCGCTGACGC TCGACGAGGC CACCTCCCTC 
GCCGACCTCC GGTTTCTCGC GGTGCGGATG CAGTCGATCG GATCGGGCGG CGTCGCGTTC 
ACGACGGTGC CGGCGGCAGC TGGCACCCGC GGGGGGCAGA GCGTCCTAGT TCCTGATCCA 
GCCCAGCTGG GCACCTTCCT CAAGCCCTTC GGCGGTCGTG TCGCCGACGG GAGCTCCACC 
GGCGCACTCC CGGCCGGCGC GGGGGGTGGC TCCTTCGCCG CGGTACCGGT GTCCGCCGCG 
GTACCGGTGG TCTGGTCCCC GACCAGCGCG GCGGGAAGGT CCGTCCCGGG TGACGCGGGC 
GGGGTGTCCT GCACCTATTG A

Protein sequence

MTWPPDRPDR PERYGPTAGR RDGERPGRSV RDPRDPRRAP EEDWPVGQWP RREHRPAPRG 
HDDDEPRVPP GAYPDPYGRY PIDHPAAEPR YDRPAPEGPV APGQGGLRRG LTAMAAVLAT 
LVLILATGGW AVLKHYDGRV HHIPLAFSAS ADRPASASGG TQNILLVGSD TRTGTNGEFG 
QVEGQRSDTT ILAHLDGDGS TTLISFPRDL WVRIPAYTDA AGTQHAAQRS KLNAAFSYGG 
PSLLVATIEN LTGIRVDHYV QIDFIGFQGM TDALGGVTVC IKELPPELKA RGFDNLHDHY 
SGFSGQVGEN TLNGAQALSF VRQRYGLPES DIDRIRRQQQ FLGAVFQRIA STDTLLNPAK 
LLGVVDSATS ALTLDEATSL ADLRFLAVRM QSIGSGGVAF TTVPAAAGTR GGQSVLVPDP 
AQLGTFLKPF GGRVADGSST GALPAGAGGG SFAAVPVSAA VPVVWSPTSA AGRSVPGDAG 
GVSCTY