Gene Francci3_3094 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3094
Symbol
ID	3904220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3665415
End bp	3666629
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	74%
IMG OID	637880415
Product	arsenite-transporting ATPase
Protein accession	YP_482180
Protein GI	86741780
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0003] Oxyanion-translocating ATPase
TIGRFAM ID	[TIGR00345] arsenite-activated ATPase (arsA)

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.968228
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGTGTG TGCTCTTCAC GGGGAAGGGC GGCGGCGGTA CCACCACGGT GGCGGCGGCG 
ACCGCGATCC TCGCCGCCCA ACGGGGTCAC CGGACCCTCG TGCTGTCGGT CGACCCGGCC 
GCGGGGCTCG CCGGCGCGCT CGACCACCCG ATCGGCGCCG AGCCGACCGA GCTTGAACCG 
GGGTTGCACG GCCAGCAGGT CGACCTGCGC CGCGCGGTCG AGACCCGGTG GCCGGCCGTA 
CGCGAGGTGC TGGCGGGCAC CTGGCCGGCC ATCAACGTCG ATCCGTTCGA CCTGGAGGAG 
TTGGCCTTCC TGCCGGGGGC CGTCGAGACC CTGACGCTGC TCGAACTGCG CGACGGTCTC 
ACCAGCGAGA ACTACGACCT GGTGGTGGTC GACGGAGGCC CGGCGGCGGC GCTGGTGCGG 
CTGCTGGCCT TTCCCGAGAC GCTGTCGTGG TACTGCCGCC GGCTGCTGCC GCCCGACGGT 
GCCTTCGCGC GCTGGCTGCG ACCCGGTTTC GGCTGGGCGG CGGCGCTCGG CGGGCGGTGG 
AGCGCGCTGG CGGCCCCCGC CTACGACACC GTCTCCCGCC TGCACCGGGC GGCGGTCGAC 
CTGCGCGCGA TCCTCACCGA CCACGCCACC ACCAGCGTCC GGCTGGTGGC GACCCCCGAG 
AGCTCGGCGC TCGCCGCGGC CCGCGGCAGC TTTACGGCGC TGTCGCTGCA CGGGTTCACT 
CTGGACGGCG TCGTCGTCAA CCGGATCTTT CCGCCGGCGA ACGCGGACGC CTGGCGGGCG 
GGGTGGGCCG CCGTTCACCG CGAGCAGCTC GCCGACATCA CCGCGGCCTT CATGCCCACC 
CCGGTCCTCC CGGTCGGCTA CCGGGCGGGC GAACCGATCG GCCTGGAGGA GCTGGCCGCT 
TTCGGCGCGG CGACCTACGG TGAGCTCGAT CCGGGGAGTG TTCTCGGGGA GCCGCTCATC 
GGCCCGAGCG GCCAGCCGCG GGTGGAACGC ACCGAGGACG GGTTCGCGCT GTCCTTCGGC 
CTGCCGTTCG TCGACAGTTC CCAGATCGAT CTGGCCCGGC TGGGTGATGA CCTGGTGGTG 
ACCGTGGGGT CGTACCGGCG GGCTGTTCCG CTGCCCGCGG CGTTGCGTCG CTGCGACGTG 
AGCACCGCCC GGCTGCGTGA CGACCGGCTG GTCGTCTCGT TCGTTCCGGA CCCGCGGCAG 
TGGGTGCGGG TATGA

Protein sequence

MRCVLFTGKG GGGTTTVAAA TAILAAQRGH RTLVLSVDPA AGLAGALDHP IGAEPTELEP 
GLHGQQVDLR RAVETRWPAV REVLAGTWPA INVDPFDLEE LAFLPGAVET LTLLELRDGL 
TSENYDLVVV DGGPAAALVR LLAFPETLSW YCRRLLPPDG AFARWLRPGF GWAAALGGRW 
SALAAPAYDT VSRLHRAAVD LRAILTDHAT TSVRLVATPE SSALAAARGS FTALSLHGFT 
LDGVVVNRIF PPANADAWRA GWAAVHREQL ADITAAFMPT PVLPVGYRAG EPIGLEELAA 
FGAATYGELD PGSVLGEPLI GPSGQPRVER TEDGFALSFG LPFVDSSQID LARLGDDLVV 
TVGSYRRAVP LPAALRRCDV STARLRDDRL VVSFVPDPRQ WVRV