Gene Cyan7425_3994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan7425_3994
Symbol
ID	7289941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7425
Kingdom	Bacteria
Replicon accession	NC_011884
Strand	+
Start bp	4027425
End bp	4029050
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	54%
IMG OID	643586965
Product	extracellular solute-binding protein family 5
Protein accession	YP_002484669
Protein GI	220909358
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0000169157
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATTAAATTCC TGGGTTTAGC CCTGTTTTGT GCTGTGTTGC TGCTGGGCTG TAGTCCTTCC 
TCCTCTCCCC CCCCCTCTAG TGGGCGAGTC ACCCTCGGCA CCACTGCTAG AGTTCGCACC 
CTTGATCCGG CAGATGCCTA CGAAGTGTTT GCTGGCACGT TGCTTTATAA CCTGGGCGAT 
CGCCTCTATA CCTACAAAGG CACCACCCTG GTTCCCCAGC TAGCCACGGC TTTACCAATT 
GTGAGTGAAG ATGGGCTGAC CTATCGCATC CCATTGCGCC AGGGTGTTCT CTTCCACGAT 
GGCACCCGCT TCGATGCCAG GGCCATGGTC TTTTCGTTAG AGCGGTTTAT CAAAAATGAG 
GGCCAGCCCT CAGCCCTGTT GGCGGGACGG GTGGAATCGA TCCAAGCGAC GGGGGAATAT 
GAGCTGGAAA TTCGCTTAAA AAAACCGTTT GTTGCTTTTC CGGCCTTGCT GGCTTTCAGT 
GGGCTGTGTG CCGTTTCCCC CAAAACCTAT GCGATCGGAG CCGGCCAATT TCTTCCAACC 
CAATTTATCG GGACGGGCCC CTACAAACTC GTGCAACTGC GCAGTGATGC GATCCGCTTA 
GAACCCTTTG CTGACTACTG GGGAACCAAA CCCGTCAATC AGGGGGTAGA TATTCAGGTC 
TTTTCCAGTG GGGCCAACCT GTTTAATGCC TTTCGCACCG GAGCGGTGGA CATTGCCACC 
CAATCGCTCG ATCCGAATCA GATTCAGGCG TTAATCCAGG GCAGTCAAAC CAAGGGCTGG 
CAGGCGATCG CGGGTTCCAG TAACTCTATT ACTGTGCTGA CCTTAAATAC CCGTCAAGCC 
CCCTGGGATC AGTTAGCCAC CCGTCAAGCC CTGGCTGCCC TGATCAATCG TCAGATTCTC 
CAAAACCGTG TTTTTCAGGG GCAGGCCGAT CGCCTATTCA GCTTGATTCC CACCATTTTC 
ACCGTCAGCC AGCCGGTCTT TCAGACCCAG TACGGGGATG GGCAGATTGA AACGGGGAAA 
GAATTTCTCA GCCGGGCAGG GTATTCCGCA GCTCAACCCC TGAAAATCAA TCTCTGGTAT 
CGCTCCAACG TCCCCAGCAA TGTTTTGGCA GCCACGGTGT TAAAGGCGGC AATCGAACGG 
GATTGGGGCG AACTGGCAGC GGTAGAACTC AGCGGGGTGG AATCGGCAAC GGCTTATCAA 
AATCTGGACA AGGGTGTTTA TCCTCTGATG ATGCTGGATT GGTACGGGGA TTTCTACGAC 
CCAGATAACT ATATTGAACC GTTCCTGGCC TGCGAACAGG GCTCTGTCCA AACAGGGTGT 
GAAGCCGGTG CCAGTGCCTC CTGGGGGTCT TTCTTCTATA GCAATCAAGC CAATCAATTG 
ATCGATCAGC AACGTCGCCA GGCCGATCCC GCCGAACGCC AGCAACTGTT TGCCCAACTC 
CAGGGAATTC TGGTTCAGAA TGTCCCATTT ATCCCCCTCT GGCAAAGTAA GAGTTATGTA 
TTTGCCCAGA AGGAAATTCA AGGGGTGCAA TTGGAACCAA CCCAGCAGTT TCTCTTAACC 
AGCATCAGCA AGTCAGGCAT CAGCAAGTCA GGCATCAGCA AGTCAGCGGG CCGCTCCAGC 
CAGTAA

Protein sequence

MKFLGLALFC AVLLLGCSPS SSPPPSSGRV TLGTTARVRT LDPADAYEVF AGTLLYNLGD 
RLYTYKGTTL VPQLATALPI VSEDGLTYRI PLRQGVLFHD GTRFDARAMV FSLERFIKNE 
GQPSALLAGR VESIQATGEY ELEIRLKKPF VAFPALLAFS GLCAVSPKTY AIGAGQFLPT 
QFIGTGPYKL VQLRSDAIRL EPFADYWGTK PVNQGVDIQV FSSGANLFNA FRTGAVDIAT 
QSLDPNQIQA LIQGSQTKGW QAIAGSSNSI TVLTLNTRQA PWDQLATRQA LAALINRQIL 
QNRVFQGQAD RLFSLIPTIF TVSQPVFQTQ YGDGQIETGK EFLSRAGYSA AQPLKINLWY 
RSNVPSNVLA ATVLKAAIER DWGELAAVEL SGVESATAYQ NLDKGVYPLM MLDWYGDFYD 
PDNYIEPFLA CEQGSVQTGC EAGASASWGS FFYSNQANQL IDQQRRQADP AERQQLFAQL 
QGILVQNVPF IPLWQSKSYV FAQKEIQGVQ LEPTQQFLLT SISKSGISKS GISKSAGRSS 
Q