Gene Francci3_1083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1083
Symbol
ID	3906426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1292146
End bp	1293414
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	74%
IMG OID	637878417
Product	hypothetical protein
Protein accession	YP_480194
Protein GI	86739794
COG category
COG ID
TIGRFAM ID	[TIGR02678] conserved hypothetical protein TIGR02678

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000423957
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGG ACTCGGTCGC CGAGGAGAAC CGGGCCGCGC GGCGCAGGGC CCTGCGCGCG 
CTGCTGGCCG GGCCGCTACG CACCGCCGGC GCGGACGACG AGGTCCTGCG GCTGGTCCGC 
CGGCACGCGT CCGAGCTGCG CGAGTGGCTC GCCGCCGAAA CCGGCTGGCG GCTGGTCGTC 
GACGCCGAAT CGGCGCGGCT GTTCAAGACG GCGGCGACCA TCCAGGACGA CACGCACCCG 
GCGCGGGAGG GGAAGGGCCG AGCGCCGTTC GGGCGGCGCC GCTACGTCCT GCTGTGCCTC 
GCGCTGTCAG TGCTGGAGGG GGCGGACACC CAGATCACCC TCGGCCGGTT GGCCGAAGGG 
GTGCTGGTCG CGGCGAGCGA CCCGGAACTG GCCCGCACCG GGGTCACCTT CACCCTCAGC 
CGCCGGGACG AACGTTCCGA CCTCGTGGCG GTGGTCCGGC TGCTGCTCAC GCTCGGCGTG 
CTGGATCGGG TCGCCGGCGA GGAGGACGCC TATCTGCGCG ACAGCGGCGA CGCGTTGTAC 
GACGTACGCC GCAGGGTGCT CGCGTCGCTG CTGACCGGTA CCCGCGGCCC GTCGACCATC 
GACGCCGACG ACATCGGGGC GCGGCTCGCC GAGCTGACCC ACGAGCCCGT CCCCGACACC 
GACGACCTGC GCAACCGGTC GCTTCGCCGC CGGTTGACCC GCCGGCTGCT CGATGATCCC 
GTCGTCTATT ACGACGAGCT CGCCGAGGAC GAGCGCGCCT ACCTGATCAG CCAGCGCCGG 
GCGATCACCA GACGGATCGA GGACGCCACC GGTCTGATCG CCGAGATGCG CGCGGAGGGA 
ATCGCGATGG TCGACCCCGA CGACGAGCTC ACCGACGTAC GGATGCCGGA ACAGCGCACC 
GACGGCCACG TGACCCTGCT AGTCGCCGAG TATCTCGCCA CCCGGCCGGA TCCCGCGGAG 
CCGGTGCCGG TCGGCCGGCT GCGTGGATAC GTTCGGAAGA TGGCGGCCGA GCATTCCACC 
TACTGGCGGC GGGGCGTCAC CGAACCGGGT GCCGACGCCG AGCTGCTCGC CATGGCGCTG 
GACAAGCTGC GCGCGCTGCG GCTGGTCACG GACGTGCCGG GCCGGGCCGG CGAGCCGCCG 
GCAGTGCTCG CCCGGCCCGC GATCGCGCGC TACGCCGTCG AGGCGCCGAC GATCCACGAC 
GGCCGGGCGG GCGGCGCCGG CCCGGTCAGA AGCGGTCCGG CCAGAAGGAA GAAGACGAGC 
CGCCGATGA

Protein sequence

MTADSVAEEN RAARRRALRA LLAGPLRTAG ADDEVLRLVR RHASELREWL AAETGWRLVV 
DAESARLFKT AATIQDDTHP AREGKGRAPF GRRRYVLLCL ALSVLEGADT QITLGRLAEG 
VLVAASDPEL ARTGVTFTLS RRDERSDLVA VVRLLLTLGV LDRVAGEEDA YLRDSGDALY 
DVRRRVLASL LTGTRGPSTI DADDIGARLA ELTHEPVPDT DDLRNRSLRR RLTRRLLDDP 
VVYYDELAED ERAYLISQRR AITRRIEDAT GLIAEMRAEG IAMVDPDDEL TDVRMPEQRT 
DGHVTLLVAE YLATRPDPAE PVPVGRLRGY VRKMAAEHST YWRRGVTEPG ADAELLAMAL 
DKLRALRLVT DVPGRAGEPP AVLARPAIAR YAVEAPTIHD GRAGGAGPVR SGPARRKKTS 
RR