Gene Tery_3696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3696
Symbol
ID	4243871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5676807
End bp	5678192
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	41%
IMG OID	638108642
Product	O-antigen polymerase
Protein accession	YP_723229
Protein GI	113477168
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3307] Lipid A core - O-antigen ligase and related enzymes
TIGRFAM ID	[TIGR00947] probable bicarbonate transporter, IctB family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.312837
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCAG TTTGGAAAAA GTTAACACTA ACTAATCTCT CATTCTCTGA CTCTGAATGG 
TTAAATGCAA GCTATCTCTA TGGTTTACTT AATGGTTCCC TCTATAACTG GCGACGTGGT 
AGTTGGTTAA TGCAATGGGG AGAACCTCTT GGTTTTGTGT TGCTAGCAAT TGTATTTACT 
CTAGCTCCTT TTGTAAATAC TACTCTCATT GGTTTCTTAT TACTTGCTAG CGCTGGTTTT 
TGGGTATTGC TGAAGGTCTC GGATAACACC CAGGAATATT TAACTCCTAT TCATCTATTA 
ATATTCCTCT ACTGGAGTAT TGCGACATTG GCAGTGGTGA TATCTCCGGC AAAGACTGCT 
GCTTTTAGTG GCTGGGTAAA GTTGACTCTT TATTTATTGT TGTTTGCTTC GGGGTCTTTG 
GTATTAAGAT CCCCTAGACT CCGCTCTTGG TTAATCAATA TTTATTTGTT GGTTTCTCTA 
GTTGTTAGTT TTTATGGTAT TCGCCAATGG ATAGATAAGG TTGAACCTCT GGCTACCTGG 
AATGATCCTA CTTCTGCTCA AGCAGGTGCG ACTCGTGTTT ATAGTTATTT GGGAAATCCT 
AATTTATTGG GTGGATATTT GTTGCCTGCT ATTGCTTTGA GTTTTGTGGC AATTTTTGCT 
TGGAGTAGTT GGGCTCGAAA ATCTCTGGCA GTAACAATAT TGCTGGTGAG TTGTGCTTGT 
TTGCGTTATA CAGGTAGTCG AGGTAGTTGG ATTGGGTTTT TAGCTTTGAT GTTTGCTATG 
TTGATTTTAA TGTGGTATTG GTGGAGGAGC TATATGCCCA GTTTTTGGCA AATTTGGTCT 
CTGCCTATAG CTGTGGGTAG TTTTGCCGGG TTGTTGATTT TAGCGGTGGT GTTGTTAGAA 
CCTTTGCGCG ATCGCGTCCT GAGTGTTTTT GCGGGTCGTC AAGATAGCAG TAATAATTTT 
CGGATGAATG TTTGGATGTC TGTTTTTGAT ATGATTCGCG ATCGCCCTAT TTTGGGTATT 
GGACCGGGTA ATGATGTGTT TAATAAGATT TATCCTCTCT ATCAGCGTCC CCGTTATAGT 
GCTTTGAGTT CTTATTCTGT GCCTTTGGAA ATTGTTGTGG AAACTGGTTT TATTGGTTTG 
ACTGCTTTTT TGTGGTTGCT TTTGGTGACT TTTAATCAGG GTGTATTGCA GTTGAAACGT 
TTGCGAGATG CTGATAACCC TCAAGGATAT TGGTTAATTG GTGCGATAGC TGCTATGGTG 
GGCTTGATAG GTCATGGTTT GGTGGATACG GTCTGGTATC GTCCCCAAGT TAATACTATT 
TGGTGGTTGA TGGTGGCTAT TATTGCTAGT TATAGCAGTC AACAGGGGGT ACGGAGTAGG 
GAATAG

Protein sequence

MNSVWKKLTL TNLSFSDSEW LNASYLYGLL NGSLYNWRRG SWLMQWGEPL GFVLLAIVFT 
LAPFVNTTLI GFLLLASAGF WVLLKVSDNT QEYLTPIHLL IFLYWSIATL AVVISPAKTA 
AFSGWVKLTL YLLLFASGSL VLRSPRLRSW LINIYLLVSL VVSFYGIRQW IDKVEPLATW 
NDPTSAQAGA TRVYSYLGNP NLLGGYLLPA IALSFVAIFA WSSWARKSLA VTILLVSCAC 
LRYTGSRGSW IGFLALMFAM LILMWYWWRS YMPSFWQIWS LPIAVGSFAG LLILAVVLLE 
PLRDRVLSVF AGRQDSSNNF RMNVWMSVFD MIRDRPILGI GPGNDVFNKI YPLYQRPRYS 
ALSSYSVPLE IVVETGFIGL TAFLWLLLVT FNQGVLQLKR LRDADNPQGY WLIGAIAAMV 
GLIGHGLVDT VWYRPQVNTI WWLMVAIIAS YSSQQGVRSR E