Gene Tery_1341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_1341
Symbol
ID	4242801
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	2042045
End bp	2043895
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	32%
IMG OID	638106518
Product	hypothetical protein
Protein accession	YP_721129
Protein GI	113475068
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.100096
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGCAA AAAAAAAATC AGAAGTTAAT TTTATAATCC TCACAATTAT CACAATTCTA 
CTACCTGCTT TTTATGTACT TTTTATGATA TCAAAGGCGG GAGAATTACT AAATTTCGAT 
TATTGGTGGA TGATTAAAAA TATCTATTCT ATAGATGGTT TCTCCACTAA TATTTTTGAC 
TGGATCTTTC GGGCAAATGA ACATTTTGTC TTAATTCCTG CCATAATTTA TGCCCTGAAT 
ATTGTTATTA CTAAAGGTTC CAATATTGGG TTATGTCTAA CTACATTTTT CCTAGCTTGT 
GTTCAGGGAA TTTTATTAAA AATCTTAGTA CCTAATACTC TCAAAAAACA TCGTCCGATA 
CTTTTCTTAC TAATTTTATT TATCTCAGTT TTTAACTTTA CCCCTGCTGC TGCTCATAAC 
TGGATGCGCG GATATAGTGG AGTACATTGG GTAATTGCTA ATTTATTTGT CATTGCCTCA 
ATTTTTTGCG TCAAAAAATT ACTAGAATCT CAACAAAATA GATTTGCTAT TACTAGTATA 
ACCTTGGGAA TTTTAGGATG TATTAGTTAT AGTACCGCTC TAGGAATTTG GCCTATATTA 
TGTGGAGTTG CCATTCTATA TAAATTGCCA AAAAAGTTGA CTTTCTCTTA TCTATTTTTT 
TCTGTTTTAG TAATAGGTAT TTATTTTATC ACCTACACAA CACCCTCTCA TCATCCCTCA 
TTATCTAAAC TGAATTTTCT TGATATAGTT ACTTACATTC CTATTTATTT AGGAGCAATT 
TTTACTCATA ATATTTCCCT GGCTTTGGCA ATAGGTTGGG TAGGATTAGT TTTAGCAGGA 
ATATTTTTAA TTTATTGGTT ATTTATAATT TATCCTCAAG ATTGGTTGCC CTGGTTATCA 
ATAATAATTT ATACTTTGGG TACTGCTTTG ATGGCTGCTG TTAGTCGTTC TGGGTTTGGA 
ATAGAACAAG CGATCGCTTC TCGTTACGGA ACCCTACCTG CTCTATTCTG GTTAAGTCTA 
ATTATTCTGA TTTTTTTATG GTTAAAACAA CAACAATTTA CCCCAAGAAG ACAATGGTAT 
TTTGTTGCTC CATTAGTGGC ACTTTTGACT ATTTTGATTA TATTAATGTA TCGAGTAGGT 
ACAGAAACTT TTAAAGAAAT TGCTCATCGG GCAACTTTTC AACCTTTAGT AGCATTATCC 
TTACAAATAG GAGTTTTAGA TCCGACTTTA ATTCAAGAGA AAGTTGGTAA CCGACCTGCT 
GCTTTTTTAG GGTTAGTAGA TGCTTTGAAA TCTGATAGTT TAGTACCTTT TAATCGAGAT 
ATAAAAAAGG ATAATTTTTG TGCTAATTTG GATGAGAAAA TTAATTCTAA TTTATTAACT 
GGAAAACTGC CAGAAAATTG GCAGGGATAT TTTGATAATG TGACTAAATT TTCTCCAACT 
ACAGCAAGAG TAAATGGATG GGTTAGTAAA GTTAAAAGTA AACTCCCCTC TTACTCTTCC 
CAAGCTAGGA AGTCAGACCC ACTATTACCT CCTTCAAACT GGGAAGTAAA AAGTCAAGAG 
AATGTTCAGA TTAAATGTAT TGCTATTTTG AATCAAGAAA ATGTAGTAAA AGGTTTTGGA 
ATGTCTGGTT TTCCTCGTGC TGATGTAGCA AATTTATTAG GAGCAGAATA TGAATTTTCA 
GGTTGGAAAG GATATATTGA GGTCAAAAGT GAAAAGTCAA AACTCGAAAG TCAAGAGAAT 
GTTCAAATCT CAGCCAAGGA AATTCTAACA GCTTATGTTA AGTTGAAAAA TCGTCAAGAT 
TGGATAGCTT TAACAAATAA ACATAGTTTT GATGGTGGTA GTGCATTATA A

Protein sequence

MLAKKKSEVN FIILTIITIL LPAFYVLFMI SKAGELLNFD YWWMIKNIYS IDGFSTNIFD 
WIFRANEHFV LIPAIIYALN IVITKGSNIG LCLTTFFLAC VQGILLKILV PNTLKKHRPI 
LFLLILFISV FNFTPAAAHN WMRGYSGVHW VIANLFVIAS IFCVKKLLES QQNRFAITSI 
TLGILGCISY STALGIWPIL CGVAILYKLP KKLTFSYLFF SVLVIGIYFI TYTTPSHHPS 
LSKLNFLDIV TYIPIYLGAI FTHNISLALA IGWVGLVLAG IFLIYWLFII YPQDWLPWLS 
IIIYTLGTAL MAAVSRSGFG IEQAIASRYG TLPALFWLSL IILIFLWLKQ QQFTPRRQWY 
FVAPLVALLT ILIILMYRVG TETFKEIAHR ATFQPLVALS LQIGVLDPTL IQEKVGNRPA 
AFLGLVDALK SDSLVPFNRD IKKDNFCANL DEKINSNLLT GKLPENWQGY FDNVTKFSPT 
TARVNGWVSK VKSKLPSYSS QARKSDPLLP PSNWEVKSQE NVQIKCIAIL NQENVVKGFG 
MSGFPRADVA NLLGAEYEFS GWKGYIEVKS EKSKLESQEN VQISAKEILT AYVKLKNRQD 
WIALTNKHSF DGGSAL