Gene Franean1_1368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1368
Symbol
ID	5669777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1649917
End bp	1651539
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	68%
IMG OID	641240295
Product	transposase mutator type
Protein accession	YP_001505722
Protein GI	158313214
COG category	[L] Replication, recombination and repair
COG ID	[COG3328] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCGC GCCAGACTGT GACGGATGTG GACTCGTTCA GCAAGGAGCT GATGACGGCG 
AGTCCGGATC TGTTGGGCTC GATGGTGAAG GCGTTCGCGG AGGCGTTGAT GGGCGCCGAG 
GTGGACGGGA TCTGCAACGC GGAATATGGG GAGATTTCCC CCGAGCGGGT GAACCGGCGG 
AACGGGTATC GGGCGCGGGA GTGGGACACC CGTGCCGGGA CGATCGAGCT GGCGGTGCCG 
AAGCTGCGGC AGGGATCGTA TTTTCCGGAA TGGCTGCTGA CCCGGCGCCG GCGTGCCGAG 
CAGGCACTGA TCTCGGTGGT CGCCACCTCC TATCTGCTGG GGGTGTCGAC CAGGCGGGTC 
GACAAACTCG TTGAACAACT CGGGGTCGCG CATATCTCGA AATCGCAGGT ATCGGTACTG 
GCGAAGCATC TCGACACCCA GGTCGAGGCG TTCCGGTCCC GGCCGTTGGA CGCCGGTCCG 
TACCGGTTCG TCCAGGCGGA CGCGTTGACG ATGAAGGTCC GTGAGGACGG CCGTGTGATC 
AACGTGCACT GCCTGCTTGC CGTGGGGGTC AACGGTGACG GGCACCGGGA GATCCTCGGC 
CTCGACGTTG TGAGCAGCGA GGACGGTGCC GGCTGGCTGG CGTTCTTCCG CGGCCTGGTC 
GCCCGAGGCC TGTCCGGGGT GCGGCTGGTG ACCTCCGATG CCCACCGGGG ACTGGTCAAC 
GCGATCGGCT CCACACTGCC CGGTGCGTCG TGGCAGAGAT GTCGGACTCA TTGGGCCTGT 
GCAGAATTAA CCCGTCGGCG TGGCGGCCTC GTCTGCCGGC AGGACAGACG CGAGGAGCTG 
TTCGGCGGAG CGGTACTTGA CGGGTGCTCG TGGCAGGTGG ATGTCGTCTT CTTCGAGGAT 
GGGGCGGACT TCGAGGAAGG CGGTGCCGAT GGTGCGGTGA CTGACGCCGA ACAGCTCGGC 
CAGGACTCGG CCGGTGGCGA CTTTGCGGTG GTGAAGGATC GCGGCCAGGA CACGTTCCCC 
GCTGGTGATC TTCTGCGGGA AGACACCGCC GCGGGTTCCG GGGAGGCGCT GGCGGCCGCG 
TTGCTGGTGG CGGCGTCGTT CCACGGCGGC TGCTTGGCGG ACCGATACCT GGTCGATGAG 
TGCGGCGAGG TCGGCGCGGC TCATGCCGGT CAGCGCGGGG TCGGACAGCG TCCAGGGCAG 
CGACGGGCGG CCGTCGTCGT ACTGTCCGGT GCGCGCGTAG GCAGTGACCT GCTCGGCGCA 
GGTGAACCGC AGGGTTGTCG GCGTGATCGT GATGTTCTGC TCGTGCAGGA GATGCCGGAC 
GTCGGTGACC GCCTGACCGA TCGTCCGCGC TGCGACTTCC AGCATGTCCG CCAGGAGCCG 
TTGAGAGCAG ACCTGGCGCA GGTGAACGAC GGTGATCAGG ACCCGGTCGC GGGGCGAGAG 
CAGGGTTCTG CCGTGGGCGC CGGGGGCGTG GCGACGTGGT CCGCCGCGTC CCTGGTAGCG 
GCGCTGCTCC CGGCGGGCCG CCTGTTCCGG CGCCAGCTGT TCTGCGAGTG CGTCCAACTC 
GGTGATGCTC ATGCCGGTCA GGCGCGGGTG GGCCAGCAGC GTCAGGGTCG CTGCCCGGTC 
TGA

Protein sequence

MAARQTVTDV DSFSKELMTA SPDLLGSMVK AFAEALMGAE VDGICNAEYG EISPERVNRR 
NGYRAREWDT RAGTIELAVP KLRQGSYFPE WLLTRRRRAE QALISVVATS YLLGVSTRRV 
DKLVEQLGVA HISKSQVSVL AKHLDTQVEA FRSRPLDAGP YRFVQADALT MKVREDGRVI 
NVHCLLAVGV NGDGHREILG LDVVSSEDGA GWLAFFRGLV ARGLSGVRLV TSDAHRGLVN 
AIGSTLPGAS WQRCRTHWAC AELTRRRGGL VCRQDRREEL FGGAVLDGCS WQVDVVFFED 
GADFEEGGAD GAVTDAEQLG QDSAGGDFAV VKDRGQDTFP AGDLLREDTA AGSGEALAAA 
LLVAASFHGG CLADRYLVDE CGEVGAAHAG QRGVGQRPGQ RRAAVVVLSG ARVGSDLLGA 
GEPQGCRRDR DVLLVQEMPD VGDRLTDRPR CDFQHVRQEP LRADLAQVND GDQDPVAGRE 
QGSAVGAGGV ATWSAASLVA ALLPAGRLFR RQLFCECVQL GDAHAGQARV GQQRQGRCPV