Gene Franean1_2461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2461
Symbol
ID	5670857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2929057
End bp	2930355
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	75%
IMG OID	641241378
Product	von Willebrand factor type A
Protein accession	YP_001506799
Protein GI	158314291
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0207463
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.636421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCGGTT TTCGGGTCGA CGTCTACACC GACGAGTACC TCCCGGACGG CGTCACCGAA 
GCGGATGCCC TGCTCACGGT CTGCGCCGAG GATGACGGCG CACCGGGCGA GCCGGACGTC 
GAGCACGTCG AGGTGATCGT CATCGACTGC TCGGGGTCGA TGAGCACACC CGCCACGAAG 
ATCTACGCCG CGCGGCGGGC CGCGTGCGCG GCCGTGGACG GCCTGCGCCC GGGGACGCTG 
TTCGCCGTGA TCCGCGGCAC CGGCACCGCC CAGGTTGTCT ACCCGCCGGG CGGCGGCCTG 
GCCCGCGCCG CCGTGGACAC CCGCGACCAG GCCCGGCGGA CCATCAACCG GATGAGCGCC 
GCCGGGGGCA CCGCGATCGG GAGCTGGCTG CTGGCGGCCC GGGACCTGTT CGCCGGCCAT 
CCCGACGCCG TCCGGCACGC CATTCTGCTG ACCGACGGGC GGAACGAGCA CGAGAGCGCC 
GCGGACTTCA CGGACGCGCT GGCCGCGTGC CGGGGGCACT TCCAGTGCGA CAGCCGGGGC 
GTGGGCCGCG GCTGGGTCGC CGCCGAGCTC ACCGCGGTGT CCGACACCCT GCTGGGCACG 
GCCCGCGACA TCGCCGACCC GGCCGATCTG GTCGCCGACT TCCAGGCGAT GACGAAGGCG 
GCGATGGCCC GCGCGCTGCC GGCGGTCTCG CTGCGGGTGT GGATCCCGCA CGGGGCGCGG 
ATCAGCACGT TCAAGCAGGT GCATCCCACC CTCGAGGACC TGCTCGAACG CGGGACGGCC 
GTCGGCGAGC AGGAGACCGA GTTCTCCACC GGGGCGTGGG GCGCCGGATG CCGTGACTAC 
CACCTCTCCG TCTCCGGCCT GCTCCCGCAC CGGATCACCC GACCGAGCCG GCTCGCCCGC 
ATCGCGGTCG TCACGGACGG GCGGCGGCTG GCCGGTGGGG ACGTCCAGGC GATGTGGACC 
GCGGACGAGC AGCTGCACAC CCAGGTCTCC CGGGAGGTGC GGCACAGCAG GGGCGTGATC 
GACCTGGCGG AGGCGATCAG GCTGGGCATG GCCGCGCGGG GCCGCGGCGA CCTCGCTGCG 
GCCGGCGCGC ACCTGGGCCG CGCGCTCGAC CTGGCCCGTG CCAGCCACGA TCAGGCGACG 
GCCGAGATTC TCGAGCAGGT GGTCGAGGCC GACCCGGCCG GGGACGCGCC GACCGGGGAC 
GCGCCGTGGG TGCGGCCCGA CGTCGACCCC CACCTGTTCG AGGTGCTCGA GGTCCGCTAC 
CGGTTCACCC GGGCTCTCGA GCCGAGGACG GCGCGGTGA

Protein sequence

MIGFRVDVYT DEYLPDGVTE ADALLTVCAE DDGAPGEPDV EHVEVIVIDC SGSMSTPATK 
IYAARRAACA AVDGLRPGTL FAVIRGTGTA QVVYPPGGGL ARAAVDTRDQ ARRTINRMSA 
AGGTAIGSWL LAARDLFAGH PDAVRHAILL TDGRNEHESA ADFTDALAAC RGHFQCDSRG 
VGRGWVAAEL TAVSDTLLGT ARDIADPADL VADFQAMTKA AMARALPAVS LRVWIPHGAR 
ISTFKQVHPT LEDLLERGTA VGEQETEFST GAWGAGCRDY HLSVSGLLPH RITRPSRLAR 
IAVVTDGRRL AGGDVQAMWT ADEQLHTQVS REVRHSRGVI DLAEAIRLGM AARGRGDLAA 
AGAHLGRALD LARASHDQAT AEILEQVVEA DPAGDAPTGD APWVRPDVDP HLFEVLEVRY 
RFTRALEPRT AR