Gene Francci3_1524 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1524
Symbol
ID	3904990
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1824983
End bp	1826509
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	70%
IMG OID	637878861
Product	hypothetical protein
Protein accession	YP_480629
Protein GI	86740229
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00211809
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCGGCCA CGCTAGCGCT GGGTCTGCTG CTGCAGGGGC TCGCCTTGGT CGTGGTGGTT 
CGCGGTCGGG GCCGGCACGC CGTGTCCAGT CTCGGGCTGA TGTTCGTCGG TGCCGCCATC 
GTCTACCACG GGGTGACGGA GGTCCTGCAG GTCCTGGTGC CGTCCTACAG TGACAACCGG 
CTGTTGACCA CGGAGTCCGA CGTCGCGGCC TACACCGTTC TGGTCGGGTT CTCCCTGCTC 
GCGTTCGCTT TCGGTTATCG CTTCGCGACC CCGCGCACGC CGCCGTCCAC CGGTTTCCGC 
CGGGAGGAAG TCTTGGACTT CTTCGACTGG CGGGTCCTGA CTCCGCTGGC CCTGGCTGCG 
GTGGCCGTGA CAGCGGTCGG CAGGAACACC TCGCCCGGCC ACGCGGACCC CTCGACGGTC 
ACCGGCAGTC CCTACCTCGT CAGCGGCTTC GCGACGCAGT TCCTGGTCGT CGGCCTCGCC 
CTGGGAAGCT TCGCCGTGCT CGTGCGGACG AAGGGCCGCG GATTCCTCCC GGTGCTCGGC 
GTCCAGTGTA CGTTGCACAC ACTGGCGGGG CAGCGGCTGC CGGTGGCGAT AGCCGCGGGC 
GCGGTGATCT ACCTACTGTC CATCGTCGGG ATTCCCATAC GCCGACGGCA GCTCGTCTCG 
GTCGTCGCGC TCGTGGTTCT GGCCTACGTC GTCATCTACG GGGCACGCGC GGACGCGGGC 
CGGCAGGTGT TCGGGTACAG CGTGGGTCCC GGGCAGCGCC TGCAGGCCCT GGCCTCCGGT 
CTGACCCATC TGGAAGGCGG GATAAACCCG GGCGAGGTGG GAGACCTCGG GGTCCGCCTG 
GACGGGAACT CCTACCCGTC GATAATCCTG CGACGGCTCC GCGACGGTTC TCCGCCCATC 
GGTCCGGTAA CCCTGTGGAA CGACGTCAAC ATCGCCGTCC CGCGTTTTCT CAATCCCGAC 
AAACTGAATT CCGACCTGGA GTCGCGTTCC CTCAAGACGC GCCTGTCCGA CACCTACGGG 
ATCACCAACG CGTTCGACCG CCTGCCCACC CAGCTCGGTG AGCTGCTGCC CATCGGCGGT 
CCGCCGTGGA TGGTGACCCT CGCGGCTCTG GCAGGATTCG TCCTCGTCCG ACTGGAGTAC 
GCGCTGCGCG AATGTCGCCA TCCAGCGGCT CTCCTGGGCC TGCTGGCGCT GGTGGCCGCG 
ATCCTGCAGT ACGAAGGCGG GATCGCGCTC TACACAATCA ACGGCCGCGG TGTCCTGGCC 
ATCGCGGCCG GACTGTTCGT GTGGCGGAAA CGACGGATCT TCCGGCCCGC GACGGTTCGG 
GGGCTGACCA CCCTACCGCC GCTGTACACC GGCACCCCGG CCACCGTCGC GCGGGCCGGC 
TCCGACGAGG ACGGCACACC GACCAACCCG TCGCAGCCCG GCCCGTCGCC GGGTGACCCG 
GTGCGGACCG AGCCGGCGTC CGCTGGCAGG GACGAGGCCG CGGCGCAGGT CACGGCCTGC 
GGCCACGGCC CACGCCGCAA CCGGTGA

Protein sequence

MSATLALGLL LQGLALVVVV RGRGRHAVSS LGLMFVGAAI VYHGVTEVLQ VLVPSYSDNR 
LLTTESDVAA YTVLVGFSLL AFAFGYRFAT PRTPPSTGFR REEVLDFFDW RVLTPLALAA 
VAVTAVGRNT SPGHADPSTV TGSPYLVSGF ATQFLVVGLA LGSFAVLVRT KGRGFLPVLG 
VQCTLHTLAG QRLPVAIAAG AVIYLLSIVG IPIRRRQLVS VVALVVLAYV VIYGARADAG 
RQVFGYSVGP GQRLQALASG LTHLEGGINP GEVGDLGVRL DGNSYPSIIL RRLRDGSPPI 
GPVTLWNDVN IAVPRFLNPD KLNSDLESRS LKTRLSDTYG ITNAFDRLPT QLGELLPIGG 
PPWMVTLAAL AGFVLVRLEY ALRECRHPAA LLGLLALVAA ILQYEGGIAL YTINGRGVLA 
IAAGLFVWRK RRIFRPATVR GLTTLPPLYT GTPATVARAG SDEDGTPTNP SQPGPSPGDP 
VRTEPASAGR DEAAAQVTAC GHGPRRNR