Gene Francci3_3314 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3314
Symbol
ID	3904100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3926019
End bp	3927164
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	637880639
Product	hypothetical protein
Protein accession	YP_482400
Protein GI	86742000
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.111602
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGACCT CAACGAGCAC CCCTCCGGGA ATCGCGCAGA CCGTTGATCT TTACGCCGAG 
CGGCTAGCTC TGCCCGAGCC CCCGCCCGAG AGCGAACCCT GGGCACCGCA GTCCCTCACG 
AAAGGCAGCG CGGGCATCGC CCTGCTCCAC ATCGAACGCG CCCACGCCGG GCTCGGCACG 
TGGCAGCAGG CCGACCGCTG GATCCGCAGC GCGGTCGCCG CGCCGGCCAA CATCACAGAC 
AACACCGGCC TGTACCTCGG CGCCCCAGCG ATCACCTTCA TGCTGGACGC CGCGGCAGGA 
AGCGACCCGA GCCGCTACCG CGGCGCCCTC GCCGCCATCG ACGGGCACGT CGCCGCGATC 
GCCCACCACC GAGCCGACGC AGCCATGGAG CGCATCGCGG CCGGGAGACT GCCAGGGTTC 
CGCGAGTACG ACGTGTTTTT CGGTCTGACC GGGATCGGCG CGCTGCTACT GCGTCGCGCT 
CCCCAGGGCA GCGCAATGGA GCGGGTTCTC GCCTACCTCG TCGCCTTGTC TAAGCCGCAT 
CGGATCGACG GGCAGACGCT GCCGGGCTGG TGGGTCAACC ACGATCCGCA CCGCCGCGCC 
TCCCCTGCCT ACCCCGGTGG GCACAGTAAC TTGGGCCTCG CTCACGGGAT AGCCGGGCCG 
CTGTCCTTGC TCAGTCGGGC GATGCGGCGT GGTGTCGTCG TCGACGGACA GCACGATACG 
ATCATAAACG TCTGCGCCTG GCTCGACGCC TGGCAGCAGG ACGGCGAAGC CGGACCCTGG 
TGGCCGGAAT GGATCACTCT GCCCGACCTG CGTCAGGGCA GAACAAGCCA GCCCGGCCCG 
GCGCGTCCCA GTTGGTGTTA CGGCACTCCC GGGCTTGCCC GCGCGGGCCA GCTCGCGGCG 
CTCGCTCTCG GTGACGGTCG CCGCCAGCAG AAGTATGAAC AGGCGCTTTT CCAGTGTCTC 
AACGATCCCG TTCAGCTGGG GCGGATCAAA GATGGTGGAC TGTGCCACGG TTGGGCCGGT 
GTGTATCAGA CAGTCTGGCG CGCAGCTCAC GATGCCATAA CACCGGTACT TGCCGACCAA 
TTGCAGTGCT TGGCTGACAA CCTGGTTCGA TTCGCTGACT TCGAGCCCGT TGCCGGCCCA 
GGGTGA

Protein sequence

MATSTSTPPG IAQTVDLYAE RLALPEPPPE SEPWAPQSLT KGSAGIALLH IERAHAGLGT 
WQQADRWIRS AVAAPANITD NTGLYLGAPA ITFMLDAAAG SDPSRYRGAL AAIDGHVAAI 
AHHRADAAME RIAAGRLPGF REYDVFFGLT GIGALLLRRA PQGSAMERVL AYLVALSKPH 
RIDGQTLPGW WVNHDPHRRA SPAYPGGHSN LGLAHGIAGP LSLLSRAMRR GVVVDGQHDT 
IINVCAWLDA WQQDGEAGPW WPEWITLPDL RQGRTSQPGP ARPSWCYGTP GLARAGQLAA 
LALGDGRRQQ KYEQALFQCL NDPVQLGRIK DGGLCHGWAG VYQTVWRAAH DAITPVLADQ 
LQCLADNLVR FADFEPVAGP G