Gene Francci3_4088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4088
Symbol
ID	3907052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4895926
End bp	4897356
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	71%
IMG OID	637881416
Product	putative replication initiation protein
Protein accession	YP_483165
Protein GI	86742765
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGACGTGG GCGTGAGCTT GCCCGAAAAC CGGCCGGTCG CGGGTGGCTG TTCCCGGCCG 
ATCCGCCTCT CCGGCCATGT CGATCATGTG GATGTTGGTA CCGGTGAGGT CCGCCGCGCG 
TTCACCTCGG CGGGTGAGCC GGGCGGCGTG TTGCATGTGC GGTGCAACAA CCGGCGTGAG 
TCGGCGTGCC CGGCGTGCTC GGCGGTCTAC AAGCGGGACG CCTGGCGGCT GGTCCTGGCT 
GGGCTCGCGG GCGGCAAGGG CGTGCCGGAG ACGGTGACCG GGCATCCGGC GTGGTTCGTC 
ACCCTGACCG CGCCGTCGTT CGGGCCGGTG CATTCCCGCC GCCAGTACGG CGGGAAAACC 
GGTCCAGTGC AGGCATGTCA CCCCCGGCGG GGACTGTGCC CGCACGGGAA ACCGGCGGGT 
TGTCATGAGC GGCACCGCGA GGATGATTCC CGGCTCGGTT CCCCGATCTG CCCGGACTGC 
TACGGCTACG GCCGGTCGGT GGTCTGGAAC GCGCTTGTTC CCCGGTTGTG GAAGGCCACG 
CGGGACGCGA CGGAATCGGC GGTGGCGGCG GCGGCCGGTC TGACGGTGGC GGGGCTGCGC 
CGTGCGGCGC GGTTGAGCTT CGTCAAGGTC GCGGAAATGC AACAACGCGG GGTCGTGCAT 
CTGCATGTGG TGGTCCGGGT GGACGGTCCG GACGGTCCCG GCTCGGCTCC TCCGGCGTGG 
GCGGCTGGTG AGCTGGTCGC GGACGCTCTG CGGGGCGTGG TCGGGTCGGT TTCGGTGCCT 
GCTCCCGATC CGGACGCGGC CACCCTCGAC GCCGGCGCTG GTGCCGGGGA TGGGTGGGCG 
GTGCGCTGGG GTGTGCAGGT CGATATCCGG CGTATCGCGC TGGATGGGCC CACCGACGTC 
GGGCGGGTCA GTAACTACCT GGCGAAGTAC ATCACGAAGT CTGCGGCGGC CGGTGGGGCG 
TTGGATCATC CGGTGCGGTC GCTGGCCGCA CTCGGCCGGC TGGTCCTGGT TCCGCATGTG 
CGCCGGTTGG TGGAGACCTG CTGGCGGCTC GGCCACGACG CCACGTTCAC GGCGGCGTTG 
GATGCGGCAC TCGGCCGGGA CTCCGGCGAT GTCCCGCGAC TGGTCCGCTG GTCTCACCAA 
ATGGGCTTTG GTGGTCACTG GCTGTCAAAG TCGCGGCGGT ACTCGACCAC GTTTGGTGCG 
CTGCGGACGG TGCGGCGAGT CTGGTCGCGC ACGATCGGTG CGGCGATGTC GGGCCGGGTG 
CCGGTGGATG CGTTCGGCCG TCCGGACGGC GATCCCGACA CGTTGGCCCT CGGGGCATGG 
ACCTACGCGG GGCGTGGTCT ATATGCCGGG GATCACGGTG ATGATCCACC TGACGGGATG 
TCGGTGCCGG CGGCTGGATC GGGTTCCGAC GTGTGGCTGG CCGGGCTATG A

Protein sequence

MDVGVSLPEN RPVAGGCSRP IRLSGHVDHV DVGTGEVRRA FTSAGEPGGV LHVRCNNRRE 
SACPACSAVY KRDAWRLVLA GLAGGKGVPE TVTGHPAWFV TLTAPSFGPV HSRRQYGGKT 
GPVQACHPRR GLCPHGKPAG CHERHREDDS RLGSPICPDC YGYGRSVVWN ALVPRLWKAT 
RDATESAVAA AAGLTVAGLR RAARLSFVKV AEMQQRGVVH LHVVVRVDGP DGPGSAPPAW 
AAGELVADAL RGVVGSVSVP APDPDAATLD AGAGAGDGWA VRWGVQVDIR RIALDGPTDV 
GRVSNYLAKY ITKSAAAGGA LDHPVRSLAA LGRLVLVPHV RRLVETCWRL GHDATFTAAL 
DAALGRDSGD VPRLVRWSHQ MGFGGHWLSK SRRYSTTFGA LRTVRRVWSR TIGAAMSGRV 
PVDAFGRPDG DPDTLALGAW TYAGRGLYAG DHGDDPPDGM SVPAAGSGSD VWLAGL