Gene Francci3_3931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3931
Symbol
ID	3906890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4704888
End bp	4706336
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	73%
IMG OID	637881258
Product	hypothetical protein
Protein accession	YP_483010
Protein GI	86742610
COG category	[R] General function prediction only
COG ID	[COG4310] Uncharacterized protein conserved in bacteria with an aminopeptidase-like domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.247655
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGATT CCTCCCGCGG CTCCGGCGGT CCCGAGCCGA ACGCTTCCCC CCTGAACGCT 
TCCCCCCCGA ACGGTTCCGA GCCCGCCGAC GCCGGCGAGT ACGCGGCGAC GGCAGGCGCC 
GACCCGGGTA CGTGGCTGCA CGACCTGGTC GCCACCCTGC TGCCCCCCAT GCGCAGCATC 
ACCGGGGACG GTGTCCGCAC GACGCTCGCC ACCGTCGCGC GGGCGCTCGG CCCGGAGCCC 
GCGCTCACGG TGCACGAGGT CCCCAGCGGG ACACCGGTCC TGGACTGGAC CGTGCCCCGG 
GAATGGAACG TCGCCTCGGC CCGGTTGACC GGCCCGGACG GCAAGACCGT CGTCGACGCC 
GCTGACAACC CGCTGCACCT GCTGGGGTAC AGCACACCGG TCCGCGCCCG GCTGTCCCTC 
GACGAGCTGC GCCCGCACCT GTTCTCGATG CCGGACCGCC CGGACTGGGT GCCCTACCGG 
ACCTCCTACT ACACCGAGAA CTGGGGCTTC TGCCTGACCG ACCGGCAGCT CGCCGCGCTG 
CCCGACGGCG AGTACGACGT GGAGATCGAC ACCACCCTCA CCGCGGGGTC GCTGACCTAC 
GGCGAGATCG TGCTGCCCGG GACCACGGAC GACGAGTTCC TCATCACGAC CCACACCTGC 
CACCCGGCGA TGGCGAACGA CAACTGCTCG GGCATCGCCA CGGCCACCCT GCTGGCCCGC 
ACCCTGGCCG GGCTGCCCCG CCGGCACACC TTCCGGCTGC TGTTCATCCC CGGCACGATC 
GGATCGATCA CCTGGCTCGC GCGCAACCGC GACACCGTCG GGCGCATTCG GCACGGGCTG 
GTGCTGACCG GCCTGGGCGA CCGGTCGGAC CCGACCTACA AGCGCAGCCG GCGGGGTAAC 
GCCGCCGTCG ACCGGGCCGC GGCGGCGGCG CTCGCCGAGA CCGGGCGGCC GCACCGGGTC 
GTCGACTTCT CCCCCTACGG CTACGACGAA CGGCAGTTCT GCTCCCCTGG CTTCGACCTG 
CCCGTCGGCC GGTTCGGGCG CGGCCAGCAC GGCGACTATC CGCAGTACCA CACGTCCGCG 
GACGACCTCG ACTTCGTGAC CCCGCAGTCA CTGGCCGACT CGTTCGCGAT CCTGCTGCGG 
ACGATCGACA TCTGCGAGCG CGACCGCATC TGGCGCAACA CCACCCCGTA CGGGGAGCCG 
CAGCTCGGCC GGCGGGGCCT GTACCGCGCC ATCGGGGCCA CCATGAACCG CCAGGCGATC 
GAGATGGGCC TGCTGTGGGT GCTGAACCTG GCCGACGGCA CGCGCAGCCT GCTCGACATC 
GCCGACCGCG CGGACCTGCC GTTCGACACC GTCGCGGCGG CGGCCGATGC CCTGGCGGGC 
GTCGATCTAC TCAGCGACGT CACCAGCAGC GACGTCACCA GCGCCGCGCC CGCGGGAGCC 
CGGCGGTGA

Protein sequence

MSDSSRGSGG PEPNASPLNA SPPNGSEPAD AGEYAATAGA DPGTWLHDLV ATLLPPMRSI 
TGDGVRTTLA TVARALGPEP ALTVHEVPSG TPVLDWTVPR EWNVASARLT GPDGKTVVDA 
ADNPLHLLGY STPVRARLSL DELRPHLFSM PDRPDWVPYR TSYYTENWGF CLTDRQLAAL 
PDGEYDVEID TTLTAGSLTY GEIVLPGTTD DEFLITTHTC HPAMANDNCS GIATATLLAR 
TLAGLPRRHT FRLLFIPGTI GSITWLARNR DTVGRIRHGL VLTGLGDRSD PTYKRSRRGN 
AAVDRAAAAA LAETGRPHRV VDFSPYGYDE RQFCSPGFDL PVGRFGRGQH GDYPQYHTSA 
DDLDFVTPQS LADSFAILLR TIDICERDRI WRNTTPYGEP QLGRRGLYRA IGATMNRQAI 
EMGLLWVLNL ADGTRSLLDI ADRADLPFDT VAAAADALAG VDLLSDVTSS DVTSAAPAGA 
RR