Gene Francci3_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3014
Symbol
ID	3904367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3579803
End bp	3581032
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID	637880334
Product	prolipoprotein diacylglyceryl transferase
Protein accession	YP_482100
Protein GI	86741700
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0682] Prolipoprotein diacylglyceryltransferase
TIGRFAM ID	[TIGR00544] prolipoprotein diacylglyceryl transferase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0478204
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCTCG CCGCTATTCC TAGCCCATCG CGTGGCGTGG TGCATCTCGG GCCGGTGCCG 
CTGCGTGCCT ACGCCCTGAT GATCATTATT GGCGTCTTCG TCGCCGTATT CGTGACGGGA 
AGAAGGCTGC GCGCTCGCGG CATGGATCCC ATGGTGGCCA GCGAGGTCGC CTACTGGGCC 
GTCCCGTTCG GCATCGTCGG CGCCCGCGTC TACCACGTGG TCAGCACTCC GGCCGCCTAT 
TTCGGCCGGG ACGGCAACGT GCTGGACGTC ATCAAGATCT GGAACGGCGG GCTGGGTATC 
TGGGGCGCCA TCGCGGGCGG GGCCTTCGGC GCGTGGCTGG CGACCCGGCG CTACGGCATC 
AGCCTCGCCC TGTTCGGCGA CGCCGCGGCG CCGGGCATCA TCCTGGCCCA GGCGATCGGA 
CGCTGGGGCA ACTGGTTCAA CCAGGAGCTG TACGGCAAGG CGAGCACCCT GCCCTGGGCG 
GTGCGCATCG ACGAGAAGCA CCAGATCATC CCCGGCGTGT CCACCTATCA GCCGACCTTC 
CTCTACGAGT GCCTGTGGAA CCTGGTGGTG GCCGGGATCC TGTTGGTCGT CGATCGGCGG 
CACCGGCTCG GCCGCGGCAA GCTGTTCTGC CTCTACGTCG CGCTCTACAC GTTCGGCCGG 
TTGTGGATCG AGATGCTGCG CATCGACACG GCGAACCAGA TCCTCGGGCT GCGGGTCAAC 
ATCTGGACCT CGATCGTCGT CTGTCTGGGG GCGTTGCTGG CGCTGGCGGT CACCCGCAGT 
CCCGTGGATC CGAATCTGTC CAGGGAGGAG CAGGAGGCCC TCGGAATCGC CCGTTCCCGG 
CCCGCGGCGC GGTCCACGGT GACGACCGCC GGTACCGCCG ACCAGCGGGC GGCCGCTCCC 
GATTCGGCCG GTCCCGATTC GGCCGCTCTC GATTCGGTCG GTCCCGATTC GGTCGATCCT 
GATCTGGGCG GTCCCGATCC GGCCGATCCT GGTTCCGCCG GGTCGGTGCC CGCCGCCGCG 
GTGCCCGATG CCTCCGGGTC GACCGCCACC ACTGCCACTA CCGCCACCAC CGCCACCACC 
GCCACTACCG CCACCACTGC CACCACTGCC ACCACTGCCA CCACCGGCGT ACCGGCTGGT 
TCGCAGCAGA GCCGCGGCCT GGCGACGAGA TTGCCGGCGA GCGGTGGGCA CACGTCGGCC 
GTTCCGCCGG AGGAGCCGCA GCTGCCCTGA

Protein sequence

MVLAAIPSPS RGVVHLGPVP LRAYALMIII GVFVAVFVTG RRLRARGMDP MVASEVAYWA 
VPFGIVGARV YHVVSTPAAY FGRDGNVLDV IKIWNGGLGI WGAIAGGAFG AWLATRRYGI 
SLALFGDAAA PGIILAQAIG RWGNWFNQEL YGKASTLPWA VRIDEKHQII PGVSTYQPTF 
LYECLWNLVV AGILLVVDRR HRLGRGKLFC LYVALYTFGR LWIEMLRIDT ANQILGLRVN 
IWTSIVVCLG ALLALAVTRS PVDPNLSREE QEALGIARSR PAARSTVTTA GTADQRAAAP 
DSAGPDSAAL DSVGPDSVDP DLGGPDPADP GSAGSVPAAA VPDASGSTAT TATTATTATT 
ATTATTATTA TTATTGVPAG SQQSRGLATR LPASGGHTSA VPPEEPQLP