Gene Franean1_5580 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5580
Symbol
ID	5673908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6760126
End bp	6761490
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	73%
IMG OID	641244434
Product	hypothetical protein
Protein accession	YP_001509838
Protein GI	158317330
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.647703
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCATCT CACCGGTTAC GGAGGCGGCA GGCGGATTGT CCGCCGCCGT CCGCCGCCGG 
CGCACACGGC GCCGGCCTCA CCTGGCGAGC CGTCAACGGA CGCGCCTGTT CACGCGCCTG 
CGGACTCGCC TCCGGACCCT GCCGATCGTG CTCGCGGCGC TGCTCGTGGC CGCCGGGTGT 
GTCTCGTGCG TGTCCTGGAA CGACTCGTCC GATGCCACGG ACTCGCACGG TTCGGGTGCC 
TCGTGCCCGC CCGTGCCGGG GGTCACGGCG GACGAGGTCC GGCTCGGCCT GCTGTTCCCG 
AACACCGGCA ACGCGGCGTC GTTGTTCGAC CCGTTCCGGG CCGGGGTCGA CGCCCGGCTC 
GGGGTGGCGA ACGCGGCCGG TGGGGTCCAG GGGCGGAGCA TCGAGTACTC GTGGCGCGAC 
GACGAATCGC AGCCCAGCGT CAACGAGACC GCGGCCCGCA TGCTCGTCGA CCAGCACCAG 
GTGTTCGGGA TCGTCGAGTC CACCACGGCC GCGGCCGGCT CGGCGGAGTT CCTGCACAGC 
CGCGGCATCC CGGTCACCGG AACGTCGCTG GAGGCGTCCT GGACCACCTT CGACAACATG 
TTCAGCTACT CGAACATGAT CGCGGACGGT GCCTCGGTGT CGACCTGGGG TGACTTCGTC 
GCCGAGCGCG GGGGGACGAC GGCGCTGATC GCCGCGTCGA GCTTCTCGGC CGCCTCGGGC 
GCCTTCGGCG AGGAGCTGGC CGCCAGCCTG GAGGCGGCCG GGGTGCGGGT CGTCGGCACC 
CTCGACGCGA CCGGGCCGAT CGACTTCGCC GACGTCGGCG CGCAGGTGCG TGACAGCGGC 
GCCGACACGC TCGTCGGGGC GGTCACGGGG GCCGCGTTCG GCCAGGTCGT GCTGGGCGCC 
CGGGGGGCCG GGGCCAACCT GCGGGTGATC CTCTCGCCGT CCGGGTACGA CCAGAGCCTG 
CTGGACGTCT TCGGCCGGGT GCTGAGCGGC GTCTACATCT TCGTCGACTA CCAGCCGTTC 
GAGCTCGACA CGCCGGGCCA CCGCGCCTTC CTCGACGCGA TGACGCGGTA CGCCCCGTAC 
CTGCAGTCGC CGAACAGGCA GGCCGCGCTC TCCGGCTGGA TCTCGACCGA CATGTTCCTG 
CGCGGGCTGG CCGAGGCCGG CCGGTGCCCG ACCCGGGAGC GCTTCATCGA GGGGCTGCGC 
GCCGTCCGCG ACTACGCCGC CGACGGGCTG CTGCCGGCGC CCATCGACTT CACGGCCTCC 
TTCGGTCAGC TCGGCCGGTG CTACACCTTC CTTCAGGTGG CTCCCGACGC GAGCCGCTTC 
GACGTGCTCC GGCCGGCACC GCGCTGCGGC CGGCTCGAGC ACTGA

Protein sequence

MRISPVTEAA GGLSAAVRRR RTRRRPHLAS RQRTRLFTRL RTRLRTLPIV LAALLVAAGC 
VSCVSWNDSS DATDSHGSGA SCPPVPGVTA DEVRLGLLFP NTGNAASLFD PFRAGVDARL 
GVANAAGGVQ GRSIEYSWRD DESQPSVNET AARMLVDQHQ VFGIVESTTA AAGSAEFLHS 
RGIPVTGTSL EASWTTFDNM FSYSNMIADG ASVSTWGDFV AERGGTTALI AASSFSAASG 
AFGEELAASL EAAGVRVVGT LDATGPIDFA DVGAQVRDSG ADTLVGAVTG AAFGQVVLGA 
RGAGANLRVI LSPSGYDQSL LDVFGRVLSG VYIFVDYQPF ELDTPGHRAF LDAMTRYAPY 
LQSPNRQAAL SGWISTDMFL RGLAEAGRCP TRERFIEGLR AVRDYAADGL LPAPIDFTAS 
FGQLGRCYTF LQVAPDASRF DVLRPAPRCG RLEH