Gene Tery_4466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4466
Symbol
ID	4246119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	6889357
End bp	6890832
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	40%
IMG OID	638109349
Product	carbohydrate-selective porin OprB
Protein accession	YP_723926
Protein GI	113477865
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.666985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACAAG TAACATCTGT ATCTCAGTTA TCAGATGTAC GACCTACTGA TTGGGCTTTC 
CAAGCTTTGC AATCTCTAGT AGAACGTTAC GGTTGTATTG CTGGTTATCC AGACGGTACT 
TATAAAGGTA ATCGGGCAAT GACTCGTTAT GAGTTTGCAG CAGGTTTAAA TGCCTGTTTA 
GAGAGAGTTA CAGAGTTAAT TGCTCTTGCA ACTGCAGATT TAGTAACTCG TGATGATTTG 
GCTGTTTTAC AACGACTTCA AGAAGAGTTT GCTGTAGAAT TAGCAGAGTT GCGTGGTCGT 
GTTGATGCCC TTGAAGCTAG AACAGCAGAA CTTGAAGCGA ATCAATTCTC TACAACTACT 
AAGCTCAATG GTGAAGTTCT ATTTTGGGTG ACTGATACTT GGGGAGAACG AGCAGAAGCT 
CGTGGTGAAC CACAAAGTGA AAACGATAGA ACTGAAGCTG CATTAGGTTA TCGGGTTCGT 
TTGAACTTTG ACACTAGCTT TATGGGTAAA GACCGCCTCA GAGCTCGTTT ACAGGCCAGA 
GATATTCCTA ACTGGAGTGC CCGGGATTTA ACTAATACTC TTATGACCAG ATTGGGTACA 
GATGAAAGTG ACCCTGACGA TACAGTGGTT CTTGATAAAT TGTTTTATCA GTTTCCTGTT 
GGTGATCAAT TACAGGTAAT TATTGGCCCT CAAGGGGTTG AAGTCGATGA CTTTCAGACT 
GTCTTATCTC CCTTTGAAAG TAGTGGTTCT GGCGCTACTT CAAGATTTGG ACGATATAAC 
CCTACTGCCT ATCGTGGACC TGATGATGGA GGACTAATTG TTCAATACAA ACCTGCTAAA 
CAATGGCAAA TTAATGCTGG TTATTTAGCT GGAGAGCCAG AAAATCCTCG AGAAGGAAAT 
GGTTTATTTA ATGGTGAACA TAGTGCGTTT GGTCAAGTTG CATTTGAACC TAATTCCAAG 
CTAGCTTTTA CAGTTAACTA TGTTCGTAAG TATTTTATTA AGGATGAGGT TAATGTTACC 
TCTAGTACAG GAAGTTTCCG AGCACGAGAC CCTTTTGATG GCAGACGAAC TACGGCTGAT 
AATATTGGAC TTGAAGCTCA GTGGAAGCTT AACGATCATG TCCAAATTGG GGGTTGGTTT 
GGTACTACCT GGGCGCGTCC TGAAGATGGT AATAATGATG ATGATGATGA CATCACTATT 
ATTAATGGCG CACTTACAAT TGCTTTTCCT GACTTATTTA AAGACGGTAG CTTAGGAGGA 
ATTATTGTTG GTGTACCACC AATTATTACA GATGGTGGTA ATGATGATAA TTTGAAAGAC 
CCTGATACTT CTGTCCATGT TGAAATTTTC TATCGTTATG CGATTAATGA CTTTATAGCA 
ATTACACCTG GTTTGTTTGT GATTACTAAT CCCAATCACG ATGAGGATAA TGAAACTCTT 
TGGGTAGGTA GTTTGAGAAC CACCTTTAAG TTCTAG

Protein sequence

MGQVTSVSQL SDVRPTDWAF QALQSLVERY GCIAGYPDGT YKGNRAMTRY EFAAGLNACL 
ERVTELIALA TADLVTRDDL AVLQRLQEEF AVELAELRGR VDALEARTAE LEANQFSTTT 
KLNGEVLFWV TDTWGERAEA RGEPQSENDR TEAALGYRVR LNFDTSFMGK DRLRARLQAR 
DIPNWSARDL TNTLMTRLGT DESDPDDTVV LDKLFYQFPV GDQLQVIIGP QGVEVDDFQT 
VLSPFESSGS GATSRFGRYN PTAYRGPDDG GLIVQYKPAK QWQINAGYLA GEPENPREGN 
GLFNGEHSAF GQVAFEPNSK LAFTVNYVRK YFIKDEVNVT SSTGSFRARD PFDGRRTTAD 
NIGLEAQWKL NDHVQIGGWF GTTWARPEDG NNDDDDDITI INGALTIAFP DLFKDGSLGG 
IIVGVPPIIT DGGNDDNLKD PDTSVHVEIF YRYAINDFIA ITPGLFVITN PNHDEDNETL 
WVGSLRTTFK F