Gene Francci3_2501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2501
Symbol
ID	3904879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2952051
End bp	2953931
Gene Length	1881 bp
Protein Length	626 aa
Translation table	11
GC content	72%
IMG OID	637879831
Product	Cl- channel, voltage gated
Protein accession	YP_481597
Protein GI	86741197
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0038] Chloride channel protein EriC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.169723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTGA CGTCACGCGG GATCTCCACC CGATGGGCAG CCCGTCCGGA GATCTACCAG 
CACCGAGCCG GCGCCGTCCT CGCGGCCCTG GCCGTCGTGA TCGGCGCGGG GGTCGGGCTC 
GGCGCGGTCG CCTTCCGCGG GCTGATCAAC CTCTTCACAG AGGTGTTCTG CGGCCGGGCG 
GACTGCTCGG TCGGCGGACG GCTGCCCAAC CCCCACATCC CGGACCTGGG TTTCTGGTTC 
CTGCTGGCCG TCCCGGTGAT CGGAGGCTTG GTCTACGGAC CGCTCATCCA CCGGTTCGCC 
CGGGAGGCCC GCGGCCACGG AGTCCCCGAA GTGATGTCCG CCGTCGCCGA ACGCGACGGC 
CGCATCTCCC CCCGCGTCTC GGCGGTGAAG TCACTGGCCT CGGCGTTGTG CATCGGTGCC 
GGAGGGTCGG TCGGCCGGGA AGGCCCGATC GTGCAGATCG GCGCGTCCCT CGGGTCGGCT 
CTCGGCCAGC TCCTGCGCGT GCCGGGCCGC CGGCTGCCGA TCCTCGTCGC CTGCGGCGCC 
GCCGGCGGCA TCGCCGCCAC CTTCAACGCC CCCGTCGCCG GCGTCCTGTT CGCCCTGGAG 
GTGATCCTGC GGACCTTCAC CGCCGAGGCC TTCGGCGTCG TCGTGCTGGC CGCCGTCACC 
GCCAGCGTCA TCGGGCGCGC CGCCTTCGGT GACACTCCCT TTCTCAGCCT GCCCACCTTC 
GCCCTTCACA GCCAGGGCGA ATACCCCCTG TTCATCCTGC TCGGCGTGGT GGCCGGCCTA 
ACCGGCGTGC TGTTCACCCG CCTGCTCTAT CTCATCGAGG ACCTCTGCGA CTGGGCCTGG 
CGCGGCCCCG AATGGCTACG CCCCGCTGTC GGCGGCCTGC TCCTCGGCAC CGTCCTGCTC 
GCCCTGCCCC AGATGTATGG CGTCGGCTAC CCGGTCCTCG AACACACCGT TCACGGCGGG 
TACGCCCTGT GGTTCCTGCT CGTCCTCATC GGCGGGAAGA TCGTGGCCAC GAGTCTCACC 
ATCGGCATCG GCGGCTCCGG CGGCGTCTTC GCCCCGTCCC TGTTCATCGG CGCGTCCACC 
GGCGCCGCCT TCGGCACCCT CGCCCACCAT ATCGCCCCGG GCACCATCGC CCCTGTCGGG 
GCCTACGCCC TGGTCGGCAT GGGTGCCGTC TTCGCCGGCG CGGCCCGCGC GCCCATCACC 
GCCGTGCTCA TCCTGTTCGA GCTCACCGGC GAGTACACGA TCATCCTCCC CCTGATGACC 
GCCGTCGTCG TCGCCACCCT GACCAGCCGG CTCCTGAGCA CCGACACCAT CTACACCCTG 
AAGCTGACCC GCCGTGGCGT CGACCTCGAC GCCTCCCACG ACCTGCGCCG CCTGCGGGCC 
ATCCCGGCCA CCGCCGCGAT GCGGTCACCG CCCCCGCCGG TCCCGGCCGG CGCGCTCCTC 
TCCGAGGTCG CCGCCCTGCT CGCCGGCTCG CCGTTCCCCG CCCGCCCCGT CACCGACGGA 
CACGGGCACT ACCAGGGGAT CATCACCACA CCGGCCGTCA CCCACGCCCT CGAGACCGAC 
GCCCGGGCCG AGCAGCGCGC CGCTGGCGAC CTCGCTGTCC GCCCTCCCGC CCTCACCGTC 
GACGACAGTG TCGCCACCGC CCTGCATGCG CTCACCGACG ACCCCGGCGC CCCGGGCCTG 
CCCGTGCTCA CCAGCGACGG CCATACCGTC GCGGGATGGG TCACCCACCA GTCGGTACTT 
GCCGCCGTCT ACCCGCCGCC GGCCGAAACG GGCGGGACGC GCACCGAACC GGTCCAACGC 
GTCGACGAAC ACCGCCTTCA GGGTCAGGTC ACTTTTCCCG GTGAGATCAC TCATCGCACA 
CGCTCCAGGA CACTCGCATA G

Protein sequence

MPVTSRGIST RWAARPEIYQ HRAGAVLAAL AVVIGAGVGL GAVAFRGLIN LFTEVFCGRA 
DCSVGGRLPN PHIPDLGFWF LLAVPVIGGL VYGPLIHRFA REARGHGVPE VMSAVAERDG 
RISPRVSAVK SLASALCIGA GGSVGREGPI VQIGASLGSA LGQLLRVPGR RLPILVACGA 
AGGIAATFNA PVAGVLFALE VILRTFTAEA FGVVVLAAVT ASVIGRAAFG DTPFLSLPTF 
ALHSQGEYPL FILLGVVAGL TGVLFTRLLY LIEDLCDWAW RGPEWLRPAV GGLLLGTVLL 
ALPQMYGVGY PVLEHTVHGG YALWFLLVLI GGKIVATSLT IGIGGSGGVF APSLFIGAST 
GAAFGTLAHH IAPGTIAPVG AYALVGMGAV FAGAARAPIT AVLILFELTG EYTIILPLMT 
AVVVATLTSR LLSTDTIYTL KLTRRGVDLD ASHDLRRLRA IPATAAMRSP PPPVPAGALL 
SEVAALLAGS PFPARPVTDG HGHYQGIITT PAVTHALETD ARAEQRAAGD LAVRPPALTV 
DDSVATALHA LTDDPGAPGL PVLTSDGHTV AGWVTHQSVL AAVYPPPAET GGTRTEPVQR 
VDEHRLQGQV TFPGEITHRT RSRTLA