Gene Franean1_6022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6022
Symbol
ID	5674343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7344818
End bp	7345945
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	641244870
Product	DNA-directed RNA polymerase subunit alpha
Protein accession	YP_001510272
Protein GI	158317764
COG category	[K] Transcription
COG ID	[COG0202] DNA-directed RNA polymerase, alpha subunit/40 kD subunit
TIGRFAM ID	[TIGR02027] DNA-directed RNA polymerase, alpha subunit, bacterial and chloroplast-type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.336367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCGT GCCGGCTCCT CTTCAGGGGC TTCCACGGCG TCATATGGCG GTCGCCGTGT 
TCGGAAGGAA GTTCTCTCAT GCTGATCGCT CAGCGTCCCT CGCTCGCCGA GGACCCGATC 
TCCGAGTTCC GGTCGCGCTT CGTGATCGAG CCGCTCGAGC CGGGCTTCGG CTACACCCTC 
GGCAACTCGC TGCGCCGCAC CCTGCTGTCC TCCATCCCGG GCGCGGCCGT GACGAGTATC 
CGGGTGGACG GCGTCCTCCA CGAGTTCTCC ACCGTTCCCG GGGTCAAGGA GGACGTGACC 
GACCTGATCC TGAACCTCAA GGAACTGGTC GTCAGCTCCG ACAACGACGA GCCGACCGTG 
ATGTACCTGC GCAAGCAGGG CCCCGGTGAG GTCACCGCGG CCGACATCGC CCCCCCGGCC 
GGCGTCGAGG TGCACAACCC CGACCTGCAC CTGGCCACCC TCAACGACAA GGGCAAGCTC 
GAGATCGAGC TGACCGTCGA GCGGGGCCGT GGCTATGTCA GCGCCGCCCA GAACAAGCAG 
CCGGGCCAGG AGATCGGTCG CATTCCGATC GACTCCATCT ACTCCCCGGT GCTGAAGGTC 
ACCTACAAGG TCGAGGCGAC CCGTGTGGAG CAGCGCACGG ACTTCGACCG GCTCATCGTC 
GACGTGGAGA CGAAGCAGTC GATCTCCCCA CGGGACGCGA TGGCCAGCGC CGGCAAGACC 
CTCGTCGGCC TGTTCGGGCT GGCCCAGGAG CTCAACGCCG AGGCGGAGGG CGTCGACATC 
GGCCCGTCCG CGGCGGACGC TGCCCTGGCC GCCGACCTGG CGCTGCCGAT CGAGGAGATG 
GACCTGACCG TCCGCTCGTA CAACTGCCTC AAGCGCGAGG GCATCCACAC CATCGGTGAG 
CTGGTGTCCC GCAGCGAGGC GGACCTGCTC GACATCCGCA ACTTCGGGCA GAAGTCGATC 
GACGAGGTCA AGACCAAGCT GGGTGCCATG GGCCTGCAGC TCAAGGACTC CCCGCCCGGG 
TTCGACCCGC GCCAGGCCGT CGACACGTAC GGCACCGACA CGTACAACCC GTCGTTCTCC 
GACCCGTCCG ATGACGGTCG CGAGTTCGTC GAGACCGAAC AGTACTGA

Protein sequence

MPPCRLLFRG FHGVIWRSPC SEGSSLMLIA QRPSLAEDPI SEFRSRFVIE PLEPGFGYTL 
GNSLRRTLLS SIPGAAVTSI RVDGVLHEFS TVPGVKEDVT DLILNLKELV VSSDNDEPTV 
MYLRKQGPGE VTAADIAPPA GVEVHNPDLH LATLNDKGKL EIELTVERGR GYVSAAQNKQ 
PGQEIGRIPI DSIYSPVLKV TYKVEATRVE QRTDFDRLIV DVETKQSISP RDAMASAGKT 
LVGLFGLAQE LNAEAEGVDI GPSAADAALA ADLALPIEEM DLTVRSYNCL KREGIHTIGE 
LVSRSEADLL DIRNFGQKSI DEVKTKLGAM GLQLKDSPPG FDPRQAVDTY GTDTYNPSFS 
DPSDDGREFV ETEQY